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; (54) Title: PROCESS FOR TRANSMITTING DIGITAL AUDIO-SIGNALS 

: (54) Bezeichnung: VERFAHREN ZUM UBERTRAGEN DIGITALISIERTER TONSIGNALE 

: (57) Abstract 

i For purposes of transmission audio-signals are numerically represented by a plurality of spectral panial band sig- 

1 nals .->y means of quadrature mirror-filtering. The quantification of the scanning values in partial bands, for example 24 
! partial bands, is regulated in such a manner that the quantifying noise levels of the individual panial band signals have ap- 
proximately the same intervals as the hearing threshold of the human ear, which results from individual partial band sig- 
; nals. " he intervals between the quantifying noise levels of the partial band signals with respect to the resulting hearing 
' :hresnold are determined by the difference between the total information How required for the coding and the total infor- 
: motion flow available for coding. The available total information flow is determined and can vary depending on the sig- 
! nals. 

(57) Zusammenfassung 

Zum Cbertragen von Tonsignalen wird mittels Quadrature-Mirror- Filterung das Tonsignal durch eine Vieizahl 
spektraler Teilbandsignale digital dargestellt. Die Quantisierung der Abtastwene in den Teilbandern, z.B. 24 Teilbander, 
wird dahingehend gesteuert, da& die Quantisierungsrauschpegel der einzelnen Teilbandsignale naherungsweise gleiche Ab- 
stande zu der aus einzelnen Teilbandsignalen resultierenden Mithorschweile des menschlichen Gehors aufweisen. Dabei 
werden die Abstande der Quantisierungsrauschpegel der Teilbandsignale bezuglich der resultierenden Mithorschweile 
durdh die Differenz zwischen dem fur die Codierung erforderlichen GesamtinformationstluS und dem fur die Codierung 
verfiigbaren GesamtinformationsfluS festgelegt. Der verfiigbare GesamtinformationsfluS wird festgelegt und lcann signal- 
j abhangig schwanken. 
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125 Kbit/s, ohne subjektive Beeint'rachtigung der Quali- 



Zur Erzielung einer noch weitergehenden Datenredukt ion 
ist es ferner bekannt (EP-OS 193 143, DE-OS 35 06 912 
sowie "Rundf unktechnische Mitte ilungen " , Bd . 30 (1986), 

IQ Heft 3, S. 117 - 123), eine Spektralanalyse des breit- 
bandigen Tonsignals mit Hilfe einer diskreten Fourier- 
Transformation ( beispie lsweise durch Fast-Fourier -Trans- 
formation) curchzuf uhren und best immte , innerhalb ver- 
schiedener Fr equenzgruppen re le van te Spektralwer te nach 

^5 3etrag und Phase so zu ccdieren, daS unter Berucksichti- 
gung der durch Mi thor schwellen beschr iebenen Verdeckungs- 
eigenschaf ten des menschlichen Gehors und gemaB unter- 
schiedlicher Qualitatskr iter ien eine hohere Datenreduk- 
tion erreicht wird. 



Das fur die Fourier-Transformation erf order liche Analyse- 
Zeitfenster betragt indessen etwa 25 ms • Dieser Wert, 
stellt einen KompromiS dar , um einerseits dem spektralen 
Auf losungsvermogen und andererseits dem zeitlichen Auf- 
losungsvermogen des menschlichen Gehors gerecht zu wer- 
den. Die mit diesem Analyse-Zeitf enster erreichbare 
spektraie Auflosung betragt lediglich 40 Hz, so daB 
im Bereich tiefer Frequenzen, wo die Frequenzgruppen- 
breite des Gehors etwa 100 Hz umfafit, nur zwei Spektral- 
werte iibertragen werden konnen. Die dabei entstehenden 
Seitenbander liegen deshalb in den benachbarten Frequenz- 
gruppen, so dnB wahrnehmbare Qualitatsbeeintrachtigungen 
nicht auszuschlieSen sind. Andererseits ist das kompro- 
miBweise gewahlte 25 ms-Analyse-Zeitf enster fur das 
zeitliche Auf losungsvermogen des Gehors zu lang . Da 
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1 bei impuishai tigen Nutzsignaiea diese Ungenau igke i t im 

Zeitbereich zu vahrnehmba re n Verzerrungen fiihrt, muG 
zur Verzerrungsverniinderung eine Anhebunq der Ampiitu- 
denwerte der zeitlich vorausgehenden Spek tralante ile 

,5 durchgefuhrt werden, was jedoch nicht in alien Fallen 
zum gewvinschten Erfolg fuhrt. Ferner durfen in der di- 
gitalen Tons tudio technik Biocklangen von etwa 5 ms 
nicht uberschr ittea werden, urn beim Schneiden von digi- 
taiisierten Tonsignaien unhorbare Schnitte zu ermoglichen 

10 Hinzu kommt ferner, daS der Prozessorauf wand insbesonde- 
re im Empfanger zur Ruck transformation der sendeseitig 
trans formier ten Signaie im Bereich ho her Frequenzen un- 
r.ctig hoch isc, da die Be ruck sicht igung psychoakus ti- 
scner Kriterien nur f requenzqruppenweise erfolgt. 



Desweitersn ist bei cam zuletzt befcrachteten, bekannten 

Verfahrsn fur die e.-?f angsseitige Ruckgewinnung der 

Spektraiverte nach Betraq u ~d ^=. Se saw* e> -C-- - 

_ — s>o«j.e tU cie esipcangs- 

seitige inverse Four ier-Transforrnation die Lfbertragung 
von Mebeninfonaationenerforderlich.Diese NebeninforJatioren 
stelleneinenrelativhohen Anteil des gesamten Netto-m^orma- 
tionstlusses dar und erfordern einen besonders wirksamen 
Fehlerschutz, welcher den Informationsf lufl des zu uber- 
tragenden, codierten Signals entsprechend erhoht . 
SchlieSlich ist bei derti bekannten Verfahren das quellen- 
codierte Signal empfindlich gegenuber Bitf ehler-S torungen , 
weil sowohl Betrag als auch Phase jedes Spektralwertes 
blockweise, d.h., nur etwa alle 25 ms Qbertragen werden, 
so daQ ein Bitfehler ein S torspek trum innerhalb dieses 
Zeitintervalls erzeugt. Die Storvirkung eines 25 ms- 
Imoulses ist wesentlich hoher als be ispielsweise di e - 
jenige GiaG s 1 ms-Impulses , welche sich bei den eingangs 
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1 erwahnten, bekannten Teilband-Ver f ahr en fur die 

fehlerhafte Ubertragung eines Teilband-Abtastwertes 
ergibt . 

5 Die Aufgabe der Erfindung besteht demgegenuber darin, 

unter Vermeidung einer Fourier-Transformation rait 
einem Verfahren der eingangs erwahnten Art die Ver- 
deckungseigenschaf ten des menschlichen Gehors voll- 
standig zu nutzen, dahingehend , da3 ein begrenzter 

10 Gesamt inf ormationsf lufl qualitatsopt imal auf die 

Spektralanteile des Nutzsignals dynamisch verteilt 
wird, ohne einen hohen Aufwand hinsichtlich der tiber- 
tragung von Nebeninf ormationen , des Fehier schut zes 
oder der erapf angsseitigen Signal verarbeitung in Xauf 

15 nehmen zu mussen. 

Diese Aufgabe wird er f indungsgemafi durch die kenn- 
zeichnenden Merkmale des Anspruchs 1 geldst. 

20 Vorteiihafte Ausgestaltungen una Weiterbildungen des 

erf indungsgemaSen Verfahrens ergeben sich aus den 
Unteranspruchen . 

Die' Erfindung beruht auf der Uberlegung, daB sowohl 
25 die gegenseitige Verdeckung der Spektralanteile des 

Nutzsignals -als auch die Verdeckung des Quantisie- 
rungsrauschens nicht nur innerhalb der jeweiligen 
Teilbander, sondern ubejr mehrere, benachbarte Teilban- 
der hinweg erfolgt. Um die Verdeckung vollstandig zu 
30 nutzen, mussen die Quantisierungen von Teilbandsigna- 

ien nach MaSgabe der aus ver schiedenen Spektralantei- 
len des Nutzsignals resultierenden Mithor schwelle ge- 
steuert werden. Die Berechnung der dazu erf order lichen 
Steuerinf ormationen geschieht signalabhangig unter 
35 Berucksichtigung der Vor-, Simultan- und Nachverdeckung 
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des menschlichen Gehors. Da einerseits der erf order liche 
Gesamt inf ormationsf luB eines derartig codierten Tonsigna- 
les signalabhangig schwankt und wenn andererseits fur den 
Anwendungsf all der Ubertragung der Inf ormationsf luB des 
ubertragenen codierten Tonsignals konstant gehalten werden 
soli, kann die daraus resultierende, signalabhangige In- 
formation sf luB -Re serve sendeseitig unter Beriicksicht igung 
zusatzlicher Kriterien verwendet werden, Insbesondere kann 
die signalabhangige Inf ormations f luB-Re serve ganz oder 
teilweise fur die Quant isierung der Teilbandsignale zur 
Verfiigung gestellt- werden, so daS sich die Abstar.de der 
Quantisierungsrauschpegel der Teilbandsignale zu der resul- 
tierenden Mithorschwelle vergroSern. Sie kann ferner ganz 
oder teilweise fur den Fehlerschutz der im Multiplexbetr ieb 
ubertragenen, codierten Teilbandsignale sowie fur den 
Fehle rschutz eines Mult iplexrahmens zur Verfiigung gestellt 
werden, so da3 sich der Fehier schut zgrad des Multiplex- 
signals erhoht . 

Die Erfindung wird nachstehend anhand der Zeichnungen 
naher erlautert. Es zeigt: 
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Fign. 1a 
und 2a 



Blockschaltbilder der sendeseitigen 
und empf angsseitigen Schaltungsteile 
zur Durchfuhrung des er f indungsgemaflen 
Verfahrens gemafl einer ersten Aus- 
f iihrungsf orm; 
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Fign. 1b 



Blockschaltbilder wie in Fign. 1a und 
2a gemaB einer zweiten Ausf iihrungsf orm; 



und 2b 
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Blockschaltbilder wie in Fign. 1b una 2b 
gemaB einer dritten Ausf uhrungsf orm ; 

Blockschaltbilder wie in Fign. 1c und 2c 
gemaB einer vierten Ausf uhrungsf orm , mit 
zusatz licher Spektral- Analyse (FFT) 
sendeseitig ; 

Blockschaltbild zur Durchfuhrung einer 
stufenweisen Datenreduktion gemaB der 
ersten Ausf uhrungsf orm des erfindungs- 
gemaBen Verfahrens 

ein Blockschaltbild fur die in den Fign. 
la, 1b und 2a vorgesehene Stufe zur 
dynamischen Verteilung des Inf ormations- 
flusses ; 

Beispiele von drei ver schiedenen Mithor- 
schwellenkurven , welche sich in der 
Frequenzlage des maskierenden Tonsignals 
untersche iden; 

die Abhangigkeit der mittleren Mithor- 
schwellenkurve gemaB Fig. 4 von fiinf 
unterschiedlichen Pegeln des maskieren- 
den Tonsignals; 

ein Frequenzdiagramm , in welchem fur 
den Vokal / 3/ die Harmonischen als 
Punkte sowie die daraus resultierende 
Mithor schwelle als durchgezogene Kurve 
aufgetragen sind; 
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Fig . 7 



ein Zeitdiagramm fur den zeitlichen 
Verlauf der Vor-, Simmultan- und Nach- 
verdeckung des menschlichen Gehors; 
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Fig . 8 



ein Teilband-Frequenzschema eines Aus- 
f uhrungsbeispiels mit insgesamt 24 Teii- 
bandern, wobei die Mithor schwellen- 
kurven gemafi Fig. 4 eingetragen sind; 
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Kurven gieicher Lautstarke von Schmal- 
bandrauschen in Abhangigkeit von der 
Bandbre ite ; 
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Fig. 10 



Fig . 1 1 



den strukturellen Aufbau der sende- 
und empf angsseitigen QMF-Filterbanke 
gemafi Fign, 1a und 2a' bzw. 1b, und 2b; 

ein Blockschaltbild der Transcodierungs - 
stufe gemafi Fign. 1a und 1b; 



Fig. 12 
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eine schematische Darstellung fur die 
Bestimmung des Skalenf aktors fur je 
acht Abtastwertes eines digitalisierten 
Tonsignals ; 



Fig. 13 



30 



35 



eine schematische Darstellung ahnlich 
wie in Fig. 12, wobei jedoch nur jeder 
zweite Skalenf aktor fur Ubertragungs- 
zwecke verwendet wird und die nicht- - 
iibertragenen Skalenf aktoren anhand von 
sog. Zuordnungsbits rekonstruiert wer- 
den, welche angeben, ob der betreffende, 
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nicht-ubertragene Skalenfaktor dem 
vorangehenden oder nachf olgenden , 
(ibertragenen Skalenfaktor zugeordnet 
1st . 

Fig. 14 Beispiel fur den tonsignalabhangigen 

Zeitverlauf des fur die Codierung 
erf order lichen Gesamtinf ormationsf lusses ; 

Fig. 15 Beispiel fur den tonsignalabhangigen 

Zeitverlauf des fur die Codierung 
erf order lichen Gesamtinf or mac ions f lusses 
sowie der Inf ormationsf luS-Reserve bei 
konstant gehaltenem Inf ormationsf luS des 
Multiplex signals ; 

Fig. 16 Beispiel fur den tonsignalabhangigen 

Zeitverlauf des fur die Codierung er- 
f or der lie hen Gesamtinf ormationsf lusses 
gemafi Fig. 15, wobei die Inf ormations- 
fluB-Reserve im wesentlichen fur einen 
dynamischen Fehlerschutz genutzt wird. 



Gesamtschema 

Wie Fig. 1a zeigt, wird ein digitalisiertes Tonsignal, 
z.B. ein hochwertiges Rundf unksignal , in eine Anzahl 
von Teilbandsignalen , be ispielsweise 24 Teilbandsignale , 
unterteilt. Die Aufspaltung des digitalen Tonsignals 
in Teilbander erfolgt vorzugsweise mit Hilfe einer aus 
Quadrature-Mirror-Filtern (QMF) bestehenden Filterbank 1 , 
deren Aufbau und Funktionsweise in Fig. 10 naher darge- 
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stellt ist und spater erlautert werden soil- Das Ein- 
gangssignal der Filterbank 1 weist beispielsweise eine 

5 

Bandbreite von 16 kHz auf und ist mit einer Auflosung 
von 16 Bit linear quantisiert. Auch groSere Bandbreiten 
und Auflosungen sind ruoglich, beispielsweise 20 kHz 
und 18 Bit, 

.0 - 

Die hohen Inf ormationsf liisse der am Ausgang der Filter- 
band 1 vorliegenden 24 Teilbandsignale werden in einer 
nachgeschalteten Transcodierungsstuf e 2 reduziert. Die 
trar.scodierten Teilbandsignale werden einer speziellen , 
spater ncch naher beschr iebenen Fehier sicherung 7 uncer- 

. 5 

zogen und einem Multiplexer 3 zugefuhrt, welcher die 
24 Teilbandsignale des Ausf tihrungsbeispiels im Zeitmulti- 
plex auf eine tlbertragungsstrecke , beispielsweise eine 
Rundf unkubertragungsstrecke , gibt . 

2 0 

Fur die Inf ormationsf luflreduktion konnen sowohl redundanz- 
reduzierende als auch irrelevanzreduzierende Verfahren 
eingesetzt werden, wobei auch Kombinat ionen beider Verfah- 
ren denkbar sind. Redundanzreduzierende Verfahren unter- 
driicken solche Inf ormationen , die fur die Rekonstruktion 

A, 

des ur spriinglichen Signals nicht bendtigt werden. Dem- 
gegenuber unterdriicken irrelevanzreduzierende Verfahren 
diejenigen Inf ormationen , welche zur Unter scheidung des 
rekonstruierten Signals vom ur spriinglichen Signal von dem 
menschlichen Gehor nicht bendtigt werden. Beispielsweise 

30 

-wird bei einem irrelevanzreduzierenden Verfahren die 
Quantisierung des Nutzsignals innerhalb jedes Teilbandes 
so gewahlt, daB das Quantisierungsrauschen durch das 
Nutzsignal gerade verdeckt ist. Bei einem irrelevanz- und 
redundanzreduzierenden Verfahren werden redundanzreduzie- 

35 
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rende Verfahren, beispielsweise adaptive PCM oder DPCM-Pro- 
zessoren, in den Teilbandern eingesetzt und so ausgelegt, 
dafl die Rekonstruktion des ur sprtinglichen Signals nicht 
vollstandig moglich ist, aber das result ierende Fehler- 
signal durch das Nutzsignal gerade verdeckt ist. 

Ein zweckmaBiges Ausf uhrungsbeispiel einer kombinierten 
Irrelevanz- und Redundanzreduktion in den Teilbandern 
wird im folgenden beschrieben. Die Quantisierung der Teil- 
bandsignale erfolgt nach Maflgabe der Mithor schwelie und 
nach MaBgabe von Skalenf aktoren . Die Skalenf aktoren 
klassieren die Spitzenwerte der Te ilband signal pege 1 inner- 
halb eines Zeit intervalls , welches dem zeitlichen Auf- 
losungsvermogen des Gehors entspricht . Sie werden einer 
zusatzlichen Irrelevanz- und Redundanzreduktion unter- 
worfen. Die Ubertragung erfolgt im Multiplexsignal , wobei 
die Fehler sicherung 8 spezielle, spater noch zu beschrei- 
bende Eigenschaf ten aufweist . 

Dynamische Informationsf luB-Verteilung 

Eine invariante Verteilung des Inf ormat ionsf lusses auf die 
Teilbander ist im Sinne einer optimalen Irrelevanzreduk- 
tion ungiinstig, well der Verlauf der Mithor schwelie von 
der spektralen und zeitlichen Struktur. des Nutzsignals ab- 
hangt. Deshalb werden erf indungsgemaB die Quantisierungen 
der Teilbandsignale in der Stufe 2 gesteuert ("dynamische 
Verteilung" des zur Verfiigung stehenden Informations- 
flusses auf die Teilbander) . 
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Die Steuersignale fur die Quantisierungen der Teilband- 
signale in der Transcodierungsstuf e 2 werden in einer 



WO 88/04117 




CT/EP87/00723 



J 



i 



Stufe 5 nach MaBgabe der spektralen und zeitlichen Mit- 
horschwellen des menschlichen Gehors gewonnen. Unter 
der Steuerung dieser Steuer signale in der Stufe 2 er- 
folgt die dynamische Verteilung des Inf ormationsf lusses 
auf die einzelnen Teilbander unter Berucksichtigung 
der Vcr-; Sirnultan- und Nachverdeckung des menschlichen 
Gehors, wie im einzelnen anhand der Figuren 5 bis 8 
noch naher erlautert wird. Dabei werden 

a) Teilbander des Nutzsignals, die durch benachbarte 
Teilbander desselben Nutzsignals verdeckt werden, 
nicht cder nur teilweise ubertragen, und 

b) Teilbander des Nutzsignals, die durch benachbarte 
Teilbander desselben Nutzsignals nicht ( vollstandig) 
verdeckt werden, nur so fein quantisiert, daB das 
resultierende Quantisierungsrauschen durch den 
hoheren Nutzsignalpegel der benachfaarten Teilband- 
signale verdeckt ist. 

Damit laflt sich eine gegenuber dem Stand der Technik 
hohere Irrelevanzredukt ion erzielen. 

Bekannte Verfahren erreichen eine Reduktion des 
Inf ormationsf lusses dadurch, daB die Quantisierung 
der Teilbandsignale nach MaBgabe der innerhalb eines 
Teilbandes wirksamen Verdeckung erfolgt. Beispielsweise 
gilt fur ein reines irrelevanzreduzierendes Verfahren 
naherungsweise die in der DE-PS 34 40 613 angegebene 
Beziehung 
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Id q. . = 32 lg 



"oi 



+ 1 



bit 



Abtastwert 



(1) 



wobei 



10 



q. die minimale Zahl der Quant isierungs- 

mxn 

stufen im Teilband i, 



^ . , f . die obere bzw. untere Grenzfrequenz 

"OL Ul 

des Teiibandes i 
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bedeuten. Der resultierende erf order liche Informations- 
fluB fiir alle Teilbander ergibt sich dann zu: 



r . = 2 - 2 (f . - f . ) • Id q, m . 
rain- 01 Ui . 



(Jbit/sJ 



(2) 
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Der resultierende erf orderliche Informationsf luB ist 
konstant, er betragt fiir eine Auflosung in 24 Teilbander 
etwa 100 Kbit/s. 
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Dieser Wert reduziert sich unter der Berucksichtigung ' 
der gegenseitigen Verdeckung der Teilbandsignale . 
3eispielsweise kann fur ein etwa gleichmaflig verdecken- 
des/ breitbandiges Nutzsignal die Auflosung aller Teil- 
bander, die auf der Frequenzachse oberhalb des ersten 
Teiibandes liegen, so reduziert werden, da8 sich der er- 
f order liche Informationsf luB um etwa 30% vermindert. Fiir 
ein schmalbandiges Nutzsignal ist prinzipiell eine wesent- 
lich groBere Datenreduktion moglich, weil der Informations- 
fluB in vielen Teilbandern zu Null gesetzt werden kann. 
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Die signalabhangig gesteuerten Quantisierungen der 
Teilbandsignale fiihren im Prinzip zu einem erf order lichen 
Inf ormationsf lufl , der weitgehend von der spektralen und 
zeitlichen Struktur des Nutzsignals abhangt und daher 
signalabhangig schwankt, etwa im Bereich 20 ... 70 Kbit/s. 
Auf die vorteilhafte Nutzung eines signalabhangig schwan- 
kenden Inf ormationsf lusses wird spater naher eingegangen. 

Skalenf aktor 

Die Trans ccdierung der Teilbandsignale erfolgt bei dem 
Ausf iihrungsbeispiei nach Fig. 1a nicht nur nach Maflgabe 
des MithSrschwellenkriteriums im Sinne einer Irrelevanz-' 
reduktion unter der Steuerung der Stufe 5, sondern femer 
nach MaSgabe von Skalenf aktoren , welche die Spitzenwerte 
der Teilbandsignalpegel innerhalb eines bestimmten Zeit- 
intervalls klassieren und welche fur die Transcodierung 
jedes Teilbandsignals dessen Auflosung innerhalb des Zeit- 
intervalls fe.stlegen. Die Einzelheiten fiir die Bestimmung 
der Skalenf aktoren in der Stufe 4 und deren Auswertung 
bei der Transcodierung in der Stufe 2 sowie deren Uber- 
tragung werden im folgenden noch naher erlautert* Skalen- 
faktoren fur die Teilbandsignale erweisen sich aus drei 
Griinden. vorteilhaft: 

1 . Sie Skalenf aktoren fiir die Teilbandsignale enthalten 
alle Inf ormationen , welche fiir die Bestimmung der 
SteuergroBe nach dem Mi thorschwellenkr iter ium in 
Stufe 5 erforderlich sind. Die tlbertragung der Skalen- 
f aktoren als Nebeninf ormation reicht daher aus / urn 
empf angsseitig eine inverse Transcodierung vorzunehmen 
(vgl. Fig. 2a). Und zwar werden aus den empfangenen 
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Skalenf aktoren die Inf ormat ionen iiber die Verteilung des 
Gesamtinf ormat ionsf lusses auf die Teilbander gewonnen. 

2. Da der durch den Skalenf aktor klass if izierte Spitzenwert 
des Teilbandsignalpegels durch die Abtastwerte des be- 
treffenden Tsi 1 bands ignal s nicht iiberschritten werden 
kann, kann folglich der Storpegel innerhalb jedes Teil- 
bandes, welcher durch Bitfehier verursacht wird, den 
Spitzenwert des Teilbandsignalpegels nicht \iber die 
Klass if izierungsgenauigkeiu hinaus uber schreiten . Dadurch 
ergibt sich durch Bitfehier grundsatzl ich ein Storspek- ■ 
trum, welches durch das Mutzsignal groBtenteils verdeckt 
ist. Selbst bei Auftreten maximaler Bitfehier, d.h. voll- 
standiger Zerstorung aller Abtastwerte, ist durch den in 
diesem Falle nur noch vorhandenen Skalenfaktor gewahr- 
leistet, da6 die spektrale Hiillkurve des Storspektrums der 
Hiillkurve des Mutzsignals naherungsweise entspricht, 
mithin eine Sprachverstandlichkeit noch erhalten bleibt. 

3* Da die Skalenf aktoren der Teilbandsignale alle wesent- 

lichen Inf ormationen enthalten, welche fur die .Bestimmung 
der SteuergroSe nach dem Mithorschwellenkr iterium erforder- 
lich sind, ist es notwendig, diese Information bei der 
Ubertragung gegen Bitfehier stark zu schiitzen. Dies kann 
z.B. durch Einfugung von Redundanz geschehen. Aufgrund 
dieser Einfugung der Redundanz ist es besonders wichtig, 
eine Minimierung der ubertragung der Skalenf aktoren vorzu- 
nehmen . Dem kann durch eine minimal notwendige Wortlange 
(sh. Abschnitt Skalenf aktorbildung) und eine von der 
Statistik des Signals und den Erf ordernissen des Gehors 
abhangige Ubertragungshauf igkeit entsprochen werden . 
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Den Erfordernissen des Gehors kann Rechnung getragen 
werden, indem die zeitliche Maskierung, vor allem der 
Effekt der Nachverdeckung genutzt wird (Irrelevanzreduk- 
tion) . Dies bedeutet, daS bei schnellem Ausklingverhalten 

\ des Tonsignals die Skalenf aktoren nicht genau bestimmt 
werden mussen, sondern z.B. aufgrund von Interpolationen 
^" von 2U fruheren und spateren Zeitpunkten ermittelten ' 

Skalenf aktoren angenahert werden konnen. Da die zeitliche 
Vorverdeckung im allgemeinen sehr kurz und stark signal- 

^ abhangig 1st (1 bis 20 ms), -us sen in Fallen schneller 
Sigr.alanstiege die Skalenf aktoren haufiger ubertracen 
werden . 

Einer Redundanzreduktion bei der Qbertragung der Skalenfak- 
toren wird entsprochen, indem bei solchen Teilbandsignalen, 
. deren Pegel sich iiber einen bestimmten Zeitraum nicht, 
Oder nur geringfiigig andern, die Skalenf aktoren nur 
selten iibertragen werden, 

Dadurch, daS nicht notwendigerweise fur alle Teilbander 
pro zeitlichen 31ock Skalenf aktoren iibertragen werden 
miissen, sondern abhangig von den Erfordernissen des 
Gehors bzw. des Tonsignals auch naherungsweise durch 
Interpolationsmechanismen bestimmt werden konnen, ergibt sich 
eine Ubertragungsrate aller Skalenf aktoren von ca. 10 
bis 20 kbit/s. 

Da erupf angsseitig die Transcodierung allein durch die 
detektierten Skalenf aktoren gesteuert wird, sind die teil- 
bandcodierten Multiplexsignale besonders unempf indlich 
gegenuber Bitf ehlers torungen , wenn die Skalenf aktoren sende- 
seitig in der Stufe 8 einer wirkungsvollen Fehlersicherung 
unterzogen werden. Der Vorteil der Verwendung von Skalen- 
f aktoren gegenuber anderen datenreduz ierenden Methoden , 
beispielsweise adaptive PCM- oder DPCM, liegt also darin, 
dafl eine hohe Unempf indlichkeit gegenuber Bitfehlern erreicht 
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wird, wenn nur der durch die Skalenf aktoren verursachte 
Nebeninf ormationsf luB effektiv geschiitzt wird. Die Hohe die- 

o 

ses Nebeninf ormationsf lusses schwankt signalabhangig etwa im 
Bereich 10 ..... 20 Kbit/s , weil zum Zwecke einer Irrelevanz- 
und Redundanzreduktion die fur die Bestimmung der Skalenfak- 
toren zugrunde gelegten Zeitintervalle (Blocklangen) der 
^ Q zeitlichen Verdeckung des menschlichen Gehors und der zeit- 
lichen' Struktur des jeweiligen Teilbands ignals entsprechen. 

Fur die ubertragung der transcodierten Teiibandsignale so vie 
der Skalenf aktoren ist also ein GesamtinformationsfluB er- '- 
forderlich, der 'signalabhangig im Bereich 30" ... 90 Kbit/s 

1 5 

schwankt. 

Nutzung des schwankenden Inf ormationsf lusses 

Durch die s ignalabhangige Schwankung des fur die Codierung 
erf orderlichen Gesamtinf ormationsf lusses kann das erf indungs- 
gemaBe Verfahren vorteilhaft ausgestaltet werden . 

Fig. 14 zeigt beispielshaf t den zeitlichen Verlauf des erfor- 
derlichen Gesamtinf ormationsf lusses . Die gestrichelte Linie 



stellt den durchschnittlich erf orderlichen Gesamtinf orma- 
tionsf luB (etwa 60 Kbit/s) dar. Dieser Wert konnte zugrunde 
gelegt werden, wenn samtliche Schwankungen innerhalb eines 
groBen Zeitabschnittes mit Hilfe eines entsprechend groBen 
Puf f erspeichers ausgeglichen werden konnen . Dies ist* fur 



den Fall der Tonsignaliibertragung wegen der entsprechend . 
langen Ver zogerungszeit nicht moglich, jedoch ergibt sich 
fur die Tonsignalspeicherung eine erste vorteilhaf te Ausge- 
staltung des erf indungsgemaBen Verfahrens: 
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1) Der Informationsf luB des Mult iplexsignales schwankt. 

Wird das Multiplexsignal so ausgelegt, daB am Ausgang des 
Multiplexers 3 in Fig. 1A der Informationsf luB in ahnlicher 
Weise schwankt wie der fur das codierte Tonsignal aufgewen- 
dete Gesamtinformationsf luB an den Eingangen der Stufen 7 
una 3/ so resultiert daraus eine besonders ■ hone Datenreduk- 
tion fur den Fall der Speicherung. Fur spezielle Speicher- 
techniken, beispielsweise Speicherung auf Rechner-Magnet- 
platcen, konnen sogar die Stufen 3, 7 und 8 entfaiien, so 
daB der zu speicherr.de Gesamtinf or^iaticnsf luB nicht hoher 
sein muB.als der erf order liche Gesamtinf crmaticnsf iu3 . 

Der Langzeit-Durchschnittswert des zu speichernden Gesamtin- 
formationsf lusses kann scgar unter 60 Khit/s liegen, veil bei 
Speicherung eines vollstandigen Programmes alle darin enthal- 
tenen kurzzeitigen Pausen {beispielsweise in der Sprache) 
nur einen sehr geringen Gesamtinformationsf lufl erfordern 
(etwa 10 bis 15 Kbit/s, hauptsachlich fur die Skalenfaktoren) . 
Fur die Speicherung von Sprache konnen daher weniger als 
40 Kbit/s zugrunde .gelegt werden. 

2) Der Informationsf lu3 des Multiplexs ignals ist konstant. 

Im Fall der Ubertragung des Multiplexsignals ist dessenkon- 
stanter Informationsf luB vorteilhaft. Da die durch Puffer- 
speicher verursachte Ver zogerungs zeit nur gering sein darf , 
konnen die Schwankungen des erf orderlichen Gesamtinf ormations- 
flusses nur geringfiigig ausgeglichen wefden. Die verbleiben- 
den Schwankungen sind beispielhaf t. in Fig. 15 dargestellt. 
Der konstante Informationsf lufl des Multiplexsignales ist 
durch die gestrichelte Gerade angegeben (90 Kbit/s) . Der 
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Bereich stel 



It somi 



t eine Informations- 



flufl-Reserve dar, die signalabhangig schwankt und auf ver- 
schiedene Weise genutzt werden kann: 

a) Fur einen erhohten Abstand der Quantisierungsrauschpegel 
zu der resul tierencien Mithor schweiie ("Erhohter Rausch- 
abstand" ) • 

b) Fur den Fehlerschut 2 7, 8 und die Bildung des Multiplex- 
signals in 3 ("Dynamischer F-ehlerschutz") . 

c) Fur die Ubertragung beliebiger Zusat z inf ormationen im 
Multiplexsignal , die nicht zeitkritisch und unabhangig 
vom Tonsignal sind, z.B. Programminf ormationen oder 
Radio text- Information ( " Z us at z signal -Ubertragung " ) 

Die Inf ormationsf luS-Reserve kann naturlich. in beliebiger 
Kombination der drei Moglichkeiten genutzt werden. Im fol- 
genden werden der erhohte Rauschabstand und der dynamische 
Fehlerschutz noch naher beschrieben. 

a) Erhohter Rauschabstand 

Quellencodierungsverf ahren , welche die Irrelevanz der 
digitalen Tonsignale vollstandig beseitigen (d.h., die 
den Effekt der spektralen Vor- / .Sira ultan- und Nachver- 
deckung vollstandig nutzen) , konnen in bestiitunten Anwen- 
dungsf alien Probleme verursachen: 
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Im Falle einer Kaskadierung derartiger Quellen- 
codierungsverf ahren kann das Quantisierungsrauschen 
die Mithorschwellen uberschrei ten . Wurde beispiels- 
weise sowohl die Speicherung als auch die Qbertra- 
gung eines Rundf unk-Programmsignals mit Hilfe eines 
derartigen Quellencodierungsverf ahrens erfolgen, 
konnen fur kritische Tonsignale Qualitatsbeein- 
trachtigungen wahrnehmbar werden. 

Im Falle einer nachtraglichen empf anger seitigen 
Anhebung cder Absenkung bestimmter Frequenzanteile 
des Nutzsignals kann sich die spektrale Verdeckung 
des Nutzsignals so verandern, daS Qualitatsbeein- 
trachtigungen wahrnehmbar werden, Diese Gefahr be- 
steht, wenn der Pegel eines Teilbandsignals , welches 
benachbarte Teilbandsignale verdeckt, empfangerseir 
tig abgesenkt wird, oder wenn der Pegel eines Teil- 
bandsignales , welches durch ein benachbartes Teil- 
bandsignal ganz oder teilweise verdeckt wird, 
empf angerseitig angehoben wird. 

Urn Qualitatsbeeintrachtigungen fur diese Anwendungs- 
falle auszuschliefien, erfolgt die erf indungsgemaBe 
dynamische Verteilung des Ihf ormationsf lusses nicht 
allein nach MaSgabe einer maximalen Datenreduktion, 
sondern auch nach MaSgabe einer Reserve an Rauschab- 
stand (sog. "mask- to-noise Reserve") . Die "mask-to-noise 
Reserve" schwankt signalabhangig , und zwar etwa propor- 
tional der Inf ormationsf luB-Reserve , wie beispielhaft 
in Fig, 15 dargestellt. 1st das Nutzsignal -z.B. so 
schmalbandig, dafl der Inf ormationsf luB in vielen Teil- 
bandern zu Null gesetzt wird, erfolgt eine entsprechende 
Erhohung des Inf ormationsf lusses (und damit der Auf- 
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losung) fur diejenigen Teilbandsignale , welche eine 
Verdeckung hervorrufen. Eine derartige Erhohung erfolgt 
soweit, wie es die Inf ormationsf luS-Reserve zulaBt. 
Daher ist die Auflosung der verdeckenden Teilbandsignale 
unter Umstanden wesentlich hoher als das Mithor schwellen- 
kriterium es erfordert. 

Der Vorteil dieser Form der dynamischen Verteilung des 
Informationsf lusses auf die Teilbander liegt darin, 
daS beispielsweise Pegeltone mit sehr hoher Auflosung 
(Z...3. 16 bis 18 bit linear quantisiert) ubertragen 
werden. Die Ubertragung einer einzelnen Spektrallinie 
mit 16 bit Auflosung in einem 500 Hz breiten Teilband 
erfordert theoretisch 16 Kbit/s, allerdings wegen der 
zu berucksichtigenden Aliasing Verzerrungen (auf welche 
spate.r eingegangen wird, vgl . Fig. 3) einen etwa doppelt 
so hohen Bit-FluB. Damit werden je nach Frequenzlage 
zwei Oder mehr Spektrallinien gleichzeitig ohne meS- 
technisch erfaSbare QualitatseinbuBe ubertragen, wenn 
etwa 500 Hz breite Teilbander und ein Bit-FluB des 
Multiplexsignals von etwa 90 Kbit/s zugrundegelegt 
werden. Wesentliche Funktionen der in Fign.- 1a und 2a 
dargestellten Teilband-Ubertragungsstrecken lassen 
sich daher meB technisch einfach uberpriifen, indem bei- 
spielsweise Sinustone beliebiger Frequenz und 
Amplitude ubertragen werden. 
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Fur den dynamischen Fehlerschutz gilt folgendes: 

Fur die Kanalcodierung, d.h. fur die Fehlersicherung 
der transcodierten Abtastwerte in Stufe 7, der Skalen- 
faktoren in Stufe 3, sowie fur die Bildung des Multi- 
plexsignals in Stufe 3 ist ein zusatzlicher Informa- 
tionsfiuB erforderlich. Entsprechend setzt sich der 
Informationsf iuQ des Mul tiplexsignals aus den fur die 
Queiien- und Kanalcodierung eingesetzten Informations- 
flu s 's en zus arr^nen . 

Die bei konstantam Informationsf lu3 des Multiplexsignals 
vorhandene dynamische Informationsf luS-Reserve ist fur 
die Kanalcodierung nutzbar, cergestalt, daQ der Fehler- 
schutzgrad des Multiplexsignals abhangig von der momen- 
ta-, vorhandsnen Informationsf luB-Reserve gesteuert wird 
(cynamischer Fehlerschutz) . Die Steuerung des Fehler- 
schutzgrades erfoigt vorteilhaft stufenweise. Fig. 1b 
zeigt beispielsweise einen stufenweise, signalabhiT^ig 
schwankenden Informationsf IuQ fur den dynamischen 
Fehlerschutz (Bersich zwischen ges tr ichel ter Gerade 
und stufenformiger Kurve) . Der durch die s tuf enf ormige 
Kurve beschriebene Informationsf lufl stellt gleichzeitig 
den fur die Quellencodierung verfugbaren Gesamtinf orma- 
tionsflufl dar; er ist etwas groBer als der erforder- 
liche Gesamtinformationsf luB . 

Der dynamische Fehlerschutz fiihrt zu einer Erhohung 
des durchschnittlichen Fehlerschutzgrades , entsprechend 
der durchschnittlich vorhandenen Inf orraa tionsf luB- 
Reserve. Damit wird die Wahrscheinlichkeit fur Storun- 
gen durch Bitfehler reduziert. Der dynamische Fehler- 
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schutz bewirkt ferner, da8 diejenigen Tonsignale, 
5 welche einen geringen Gesamtinf ormationsf luB erfordern, 

mit hohem Fehlerschutzgrad iibertragen werden und Ton- 
signale, welche einen hohen Gesamti^nf ormationsf luS 
erfordern, mit geringem Fehlerschutzgrad iibertragen 
werden, Diese Fehlerschutzeigenschaf t wirkt sich be- 

10 sonders vorteilhaft aus, weil Tonsignale, die einen 

geringen Gesamtinf ormationsf luB benotigen, die durch 
3 i tf ehler verursachten Storsignale nur schwach ver- 
decken. Gerade diese empf indlichen Tonsignale werden 
stark geschutzt- 3eis?ielsweise ist fur ein Sprach- 

15 signal, insbesondere in den Sprachpausen , oder wahrend 

bestimmter Musikpassagen ("Stille im Konzertsaal") der 
erf order liche Gesamtinf ormationsf lu 3 besonders gering 
und damit der Fehlerschutzgrad besonders hoch. 

2Q Die Auslegung des dynamischen Fehler s chut z grades er- 

folgt zweckmafiigerweise derart, daB bei gegebener Bit- 
fehlerrate die subjektive Storwirkung naherungsweise 
unabhangig vom Tonsignal ist.. 

25 Qualitatsabstuf ung 

Ein weiteres Merkmal des erf indungsgemaBen Quellenco- 
dierungsverf ahrens ist die Moglichkeit, sendeseitig 
in der jjtuf e 6 (Fig. 1b ) die Qualitat der Quellencodie- 
30 rung festzulegen. Die in der Stufe 5 festgelegten und 

spater anhand der Fign. 4 bis 3 naher erlauterten 
Kriterien fur die Quantisierungen der Teilbandsignale 
werden mit Hilfe der Qualitatsf estlegung (Stufe 6) be- 
wertet. Dies geschieht auf folgende Weise: 
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a) Der fiir die Codierung des Tonsignales verfugbare 

5 Gesamtinf ormationsf luS wird durch die Qualitatsf es t- 

legung bestimmt. 

b) Der fur die dynamische Verteilung bereits vorbe- 
schriebene Gesichtspunkt "Erhohter Rauschabstand" 

10 wird bewertet. Die "mask-to-noise-Reserve" wird 

abhangig von der Qualitatsf estlegung dimensioniert . 

c) Das Mithorschwellenkr iterium wird abhangig von "der 
Qualitatsf estlegung so ausgelegt, dafl bestimmte 

15 . kritische Nutzsignale, die einen hohen Gesamtinf or- 

mationsf lufl erfordern und selten vorkommen, wahr- 
nehmbare, aber nicht storende Qualitatsbeeintrach- 
tigungen aufweisen. Beispielsweise werden Quali- 
tatsabstuf ungen durch die Wahrscheinlichkeit fest- 

20 gelegt/ mit welcher ciese Quali tatsbeeintrachti- 

gungen auftreten. 

d) Abhangig von der Qualitatsf estlegung wird fiir kri- 
tische Nutzsignale eine Anzahl der Teilbandsignale 

25 zu Null gesetzt. Dies geschieht vorrangig fiir Teil- 

bandsignale mit groSerer Bandbreite bzw. groSerem 
Inf ormationsf luB und zusatzlich nach MaBgabe mini- 
maler Storwirkung: Die verhaltnismaSig hohe Stor- 
wirkung bei nicht ausreichender Auflosung bestimmter 

30 Teilbandsignale wird vermieden, indem zusatzlicher 

Inf ormationsf luB zugunsten dieser Teilbandsignale 
durch Nullsetzen unwesentlicher Teilbandsignale ge- 
wonnen wird. Unwesentliche Teilbandsignale sind 
solche, die im Verhaltnis zu anderen Teilbandsignalen 

35 einen geringen Pegel aufweisen und nur einen unbe- 
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deutenden Beitrag zur Wahrnehmung der Klangfarbe 
lief em . 

Wesentlich ist, da8 eine Reduktion des Gesamtinf orma- 
tionsflusses mit einer minimalen Reduktion der Qualitat 
verbunden ist, weil die dynamische Verteilung des 
Inf ormationsf lusses auf die Teilbander durch Stufe 5 
nicht nur nach MaBgabe des zur Verfugung stehenden 
Gesamtinf ormationsf lusses , sondern auch nach MaBgabe 
von qualitatsstuf enspezif ischen Kriterien erfolgt. 

Durch eine stufenweise Reduktion der Qualitat ist es 
moglich, anstelle eines Nutzsignals zwei oder mehrere 
Nutzsignale gleichzeitig mit demselben Inf ormations- 
fluB des Multiplexsignals zu iibertragen. Da durch die 
Qualitatsf estlegung in der Stufe 6 der fur jedes Nutz- 
signal zur Verfugung stebende Gesamtinf ormationsf luB 
festgelegt ist, wird die Qualitatsabstuf ung so gewahlt, 
da8 mit Wahl der Qualitat die Zahl der ubertragbaren 
Kanale festliegt und umgekehrt. Dazu werden die Kanal- 
sperre 9 (Fig. 1b) sowie die Multiplexstuf e 3 ent- 
sprechend geschaltst. Die Schaltinf ormation wird im 
Multiplexsignal mitubertragen ,um empf angsseitig eine 
qualitatsstuf enadaptive Decodierung zu ermoglichen. 
Eine Fehlersicherung der Schaltinf ormation erfolgt 
dadurch, daB diese Schaltinf ormation haufiger als be- 
notigt ubertragen wird, beispielsweise im 1 OO ms-Inter- 
vall. 
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Folgende Korrelation zwischen Qualitatsabs tuf ungen und 
Kanalzahl 1st denkbar: 

o 



10 



15 



Anwendung 


Qualitats- 
s tuf e 


* Kanal- 
zahl 


BitfluB pro 
Kanal 


Speicherung , Lfber- 
tragung/ Studio 


1 


1 


- 200 k:bit/s 


Speicherung/ U ber- 
tr agung / S tandard 


2 


2 


100 kbit/s 


tfbertraaung/Kommentar 


3 


3 


65 kbit/s 


Obertragung/Telef on 


4 


6 


33 kbit/s 



Eine Reduktion des Inf ormationsf lusses pro Kanal fiihrt in 
charakteristischer Weise nur fiir solche Nutzsignale zu 
einer Qualitatsbeeintrachtigung , welche auch nach er- 

2 5 folgter Irrelevanzunterdruckung und Redundanzreduktion 

einen hoheren Inf ormationsf luB benotigen als beispiels- 
weise gemaS vorstehender Tabelle zugelassen ist. Die vor- 
liegend vorgesehene stufenweise Reduktion des Informa- 
tionsf lusses zeichnet sich dadurch aus, daS die Wahr- 

30 scheinlichkeit fur das Auftreten qualitatsbeeintrachtig- 

ter Signale geringer ist als bei bekannten Verfahren zur 
stufenweisen Reduktion des Inf ormationsf lusses . Die Wahr- 
scheinlichkeit fiir das Auftreten qualitatsbeeintrachtig- 
ter Sprachsignale beispielsweise ist fur die Qualitats- 
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stufen 1 'bis 3 der Tabelle gleich null und fiir die 
Qualitatsstufe 4 kleiner als 100%, wobei der Grad der 
Quali tatsbeeintrachtigung wesentlich niedriger liegt als 
bei der fiir Telef onsignale iiblichen Bandbreitenreduktion . 

Empfanger 

Empf angsseitig werden gemaB Fig. 2a in der Demultiplex- 
Stufe 13 die f ehlerges icherten transkodierten Teilband- 
signale, die dazugehor igen fehlergesicherten Skalenf ak- 
toren sowie -die Information zur sendeseitig festgelegten 
Qualitatsstufe zuruckgevcnnen. Mit Hilfe der Qualitats- 
stuf en-Information kann die Anzahl der alternativen' 
Kanale im Display 16 (Fig. 2b) angezeigt werden, so daS 
am Kanal-Wahlschalter 19 die von der Demul tipiex-S tuf e 13 
auszugebenden Daten vom Horer festgelegt werden konnen. In 
den Stufen 17 und 18 werden die Fehlersicherungsdaten der 
transkodierten Teilbandsignale bzw. der Skalenf aktoren 
entf ernt sowie FehlerkorrekturmaBnahmen durchgef uhrt . 
Die Skalenf aktoren dienen wie auf der Sendeseite als 
Eingangs information der Stufe 1 5 zur Steuerung der Ver- 
teilung des Inf ormationsf lusses auf die Teilbander. Die 
Stufe 15 ist daher identisch mit der sendeseitigen Stufe 
5 (vgl. Fig. 3). Nach MaSgabe der in Stufe 15 gewonnenen 
Steuer inf ormationen , der Skalenf aktoren sowie der Quali- 
tatsstuf en-Information erfolgt in der Stufe 1 2 die zur 
sendeseitigen Stufe 2 inverse Transkodierung , so daB 
16 bis 18 bit-linear-quantisierte Teilbandsignale an der 
inversen QMF-Filterbank 1 1 anliegen und hier die Ruckge- 
winnung des breitbandigen digitalen Tonsignals erfolgen 
kann. Einzelheiten zum Aufbau und zur Arbeitsweise der 
QMF-Filterbank 11 werden spater anhand der Fig. 10 noch 
naher erlautert. 
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Zweites Ausf uhrungsbeispiel 

Ein weiteres Ausf uhrungsbeispiel des erf indungsgemaSen 
Verfahrens ist in den Fign. 1c (Sendeseite) und Fig. 2c 
(Empfangerseite) veranschaulicht . Die sendeseitige Kodie- 
rung gemaB Fig. 1c ist identisch mit dem vorstehend be- 
reits erlauterten Ausf uhrungsbeispiel gemafl Fig. 1b. Ab- 
weichend hiervon ist in Fig. 1c vorgesehen, die Steuer- 
informationen fur die Verteilung des Inf ormationsf lusses 
auf die Teiibancer im Multiplexsignal zu iibertragen, wo- 
bei in Stufe Sb eine Fehlersicherung der S teuer inf orma- ' . . 
tion erfoigt, deren Wirksamkeit ahnlich bemessen wird wie 
diejenige der Skaienf aktor-Fehlersicherung in Stufe 8a. 
Bei der empf angsseitigen Dekodierung gemafl Fig. 2c werden 
in Abweichung von Fig. 2b die S teuer inf ormationen nicht 
nach MaSgabe der Skaienf aktoren neu ermittelt (wie dies 
in Stufe 15 gemaB Fig. 2b erfoigt), sondern direkt dem 
Multiplexsignal entnommen. In den Stufen 18a und 18b 
werden die Fehlersicherungsdaten der Skaienf aktoren bzw. 
der Steuerinforniationen entfernt sowie Fehlerkorrektur- 
mafinahmen durchgef iihrt . 

Das betrachtete zweite Ausf uhrungsbeispiel erfordert 
gegeniiber dem AUsf uhrungsbeispiel gemaB Fign- 1b und 2b 
empfangsseitig einen geringeren technischen Auf wand, da 
die fur die inverse Transkodierung in Stufe 12 erf order- 
lichen Steuerinformationen nicht neu ermittelt zu werden 
brauchen.- Der fur die Obertragung und Fehlersicherung 
der Steuerinformationen erf orderliche zusatzliche Informa- 
tionsfluS ist etwa so groS wie fur den Skaienf aktor . 
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We its re Ausf uhrunqs forme n 

Weitere Ausf iihrungsf ormen sowie vorteilhafte Ausgestal- 
tungen und Weiterbildungen des erf indungsgemaBen Verfahrens, 
insbesondere gemafl Fign. 1d, 2d und 1e, werden im Verlauf 
der folgenden Beschreibung erlautert. 

F I N7ELHE I TEN DES VERFAHRENS 
5 te uerunc des Informations z lusses 

Die anhand vcn Fig . 3 naher eriauterte Stufe 5 zur Abiei- 
tung des Mithorschwellenkr iter iums umfaBt die getrennte 
Ermittlung der spektralen Mithorschwellen im Block 5.1 
und der zaitlichen Mithorschwellen in Block 5.2. Dies 
geschieht unter Berucksichtigung des verfugbaren Gesamt- 
informationsf lusses durch die Stufe 5.5 sowie in Abhangig- 
keit qualitatsstuf snspezif ischer Kriterien in Stufe 5.6. 
Dabei sind die Stufen 5.1, 5.2 und 5.5 in Serie geschal- 
tet, wobei die Stufe 5.1 mit dem Ausgang der Stufe 4 und 
ein Steuereingang der Stufe 5.5 mit der Stufe 6 verbunden 
sind. Desweiteren ist ein erster Steuereingang der 
Stufe 5.1 ebenfalls mit der Stufe 6 verbunden, wahrend 
ein zweiter Steuereingang der Stufe 5.1 von der 
Stufe 5.6 gespeist wird. 
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Da in der QMF-Filterbank 1 bei stark unter schiedlicher 

5 Quantisierung benachbarter Te i Lbands ignale Aliasing- 

Verzerrungen auftreten, erfolgt durch eine Stufe 5.4 

eine Sollvorgabe bezuglich der maximal zulassigen 

Quar.tisierungsunterschiededer beiachbarten Teilbandsigna- 

le dahingehend, daS die Aliasing-Verzerrungen unhorbar 

10 bleiben. Die Stufe 5.4 stauert hierzu die Ausgangsstufe 

5.3, die nit dem Ausgang der Stufe 5.5 verbunden ist. 

Auf diese Weisa wird in der Ausgangsstufe 5.3 die Ver- 

teiiung der Quantisierung unter Beriicksichtigung der 

Mitr.crschvaller.vcrriba du'c h d = = --•.-=> - i .,_ ^ - -> ^ ^ _ 

— - — - • ■ 3 . - , '_a _ 

15 Vorgabedes verf ugbaren Gesamtinf ooationsf lusses durch di. 
Stufe 5.5 sowie der Aliasing-Ver zerrungvorgabe durch die 
Stufe 5,4 festcelect. 
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Mithorschwe 1 lenkr iter ium 



Eine statische Verteiiung der Quantisierung der Ausgangs- 
signaie innerhalb der einzelnen Teilbander nach deru 
Stand der Technik berucks ichtigt nur die Maskierung des 
innerhalb dieser Teilbander begrenzten Quantisierungs- 

25 rauschens durch das Nutzsignal in deruselben Band. Allein 
durch die bekannte Berucksichtigung der Maskierung des 
Quantisierungsrauschens innerhalb der Teilbander lafit 
gemaS Gleichung (1) bei der gewahlten Aufteilung des 
breitbandigen Signals 24 Teilbander eine Reduktion der 

30 Datenrate gegenuber einer 1 6-bit-linear-PCM-Codierung 

urn -tva 400 kbit/s erreichen. Demgegenuber 

errr.dglicht die vorliegend vorgesehene dynaraische (signai- 
abhangige) Steuerung der Quantisierung der Teilbandsignale 
einerseits bei gLeicher subjektiver Quaiitat eine weiter- 

35 gehende Reduzierung der Datenrate sowie eine zusatzliche 
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signalspezif ische Qualitatsreserve , andererseits bei 
nicht verrinqerter Datenrate eine weitergehende 
Qualitatsreserve . 

Soektrale Mithor schwe lien 



10 



15 



20 



25 



30 



35 



Die vorliegend vorgesehene Steuerung der Quantisierung 
erfolgt gemafl .der maskierenden Wirkung eines TeiLbandsigrtals 
mit hohem Signalpegel auf die benachbarten Teilbander. 
Diese. ruaskierende Wirkunq kann bei Antaendung des Teilband- 
schemas nach Fig. 3 Lt, v.e sent lichen L-a Frecuenzhereich oberhalb 
von 2 kHz genutzt werden, wobei im Bereich bis 3 kHz 
Teilbander gieicher absoluter Breite von 500 Hz zugrunde- 
gelegt sind. In Abweichung hiervon bezieht sich die Fre- 
quenzselektivitat des menschlichen Gehors und damit auch 
die spektrale Maskierung auf konstante relative Bandbrei- 
ten, den scgenannten Frequenzgruppen . Die in den vorlie- 
genden Teilbandschema nach Fig. 8 gewahlten absolut kon- 
sianten Bandbreiten entsprechen im.3ereich von 2 bis 4 kHz 
in etwa der Frequenzgruppenbreite und sind im Frequenzbe- 
reich oberhalb von 4 kHz wesentlich schmaler als die 
Frequenzgruppen des Gehors. In diesem Bereich ist folg- 
lich eine starkere Maskierung benachbarter Teilbandsignale 
zu erwarten, wie Fig. 8 schematisch zeigt. 

Fig. 4 zeigt fur f requenzgruppenbreites Rauschen mit den 
Mittenf requenzen 250 Hz, 1 kHz und 4 kHz als maskierender 
Schall die Mithorschwellen . Der Pegel des maskierenden 
Rauschens betragt in alien drei dargestellten Fallen 
L - 60 dB. Die Mithorschwellen, aufgetragen iiber eine 
logarithmische Frequenzachse weisen bei den Mittenfre- 
quenzen von 1 kHz und 4 kHz naherungsweise dieselbe Form 
auf; dagegen ist der Verlauf bei der Mittenf requenz 
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von 250 Hz deutlich verbreitert. Obwohl der Pegel des 
Storrauschens konstant gewahlt wurde , ist die Differenz 
des Maximums der Mithor schweile nur gestrichelt einge- 
tragen (60 dB-Linie bei 250 Hz nur etwa 2 dB, bei 4 kHz 
wachrt die Differenz jedoch auf 5 dB an) . Desweiteren 
steigen die Mithor schwellen an der unteren Flanke mit 
etwa 100 dB/Oktave sehr steil an und fallen nach hohen 
Frequenzen hin wesentlich flacher ab . Dies bedeutet, daB 
tiefe laute Tone hauptsachlich hohere leise Tone ver- 
decken . 



^ - Die Steilheit der oberen Flanke ist vom Pegel des maskie- 
renden Schalles abhangig. Diese Abhangigkeit ist in 
Fig. 5 dargestellt. Bei kleinen Pegeln fallen die Mithor- 
schwellen zu hoheren Frequenzen hin steil ab, wahrend bei 
mittleren Pegeln und noch ausgeprag ter* bei hohen Pegeln 

2Q der Abfall flacher wird. Dieser Abfall betiragt bei einem 
Pegel von 70 d3 etwa 40 d3/0ktave . Die Frequenzabhangig- 
keit der Mithor schweile ist also zusatzlich vom Pegel des 
Storschalles abhangig . 

25 Typischerweise bestehen die zu (ibertragenden Signale 

nicht nur aus einem einzigen Ton, sondern aus einer. Viel- 
zahl von Harmonischen (z.B. Musikinstrument , stimmhafte 
Sprachlaute) , oder breitbandigem Rauschen (z*B. Zisch- 
laute) . Je nach Zusammensetzung der Amplituden 

3Q dieser Harmonischen sind die von solchen Signalen hervor- 
gerufenen Mithorschwellen sehr verschieden. So verur- 
sacht eine Trompete mit vielen Harmonischen eine viel 
breitbandigere Verdeckung als eine Flote , deren Ton ein 
Spektrum besitzt, das fast nur ' aus einer einzigen Linie 

35 besteht. Fig. 6 zeigt z.B. die Mithorschwellen des 
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Vokals / dl • Der Pegel der einzelnen Harmonischen ist 
durch die schwarzen Punkte markiert, die result ierende 
Mithor schwelle durch die ausgezogene Linie angedeutet. 
Trotz gegenseitiger teilweiser Maskierung sind die ersten 
neun Harmonischen wahrnehmbar, wahrend die 10. und 11. 
Harmonische vor allem durch die 8. Harmonische verdeckt 
sind. Die Harmonischen Nr. 13 bis Nr. 17 sind aufgrund 
ihrer schwachen Pegel durcK die relativ starke 12. Har- 
monische maskiert . 



Die spektrale Verdeckung eines beliebigen Schallsignals 
kann in den Block 5.1 (Fig. 3) f olgendermaBen berechnet 
werden ( Einzelhe iten zur Berechnung der Mithor schwellen 
sind in der Literaturstelle "Algorithm for Extraction 
15 of Pitch and Pitch Salience from Complex Tonal Signals"; 
Terhardt, E., Stoll, G., Seewann, M.; J. Acoust. Soc . 
Am 7 1,-1982, pp 679-688, beschrieben) . ■ 
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Dabei bedeutet die Ruhehor schwelle des i-ten 

i 

Teilbandes, welche tabellarisch an den Grenzf requenzen 

f des Teilbandes i vorliegt. 
ui 



ur die Tonheit z als MaB fur die Frequenzgruppe des 



Gehors gilt: 
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5 z =-^13 arc tan [ 0 , 76 (f/kHz)] + 3,5 arc tan (f/7,5 kHz) J j 
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(4) 



wobei z ebenfalls tabellarisch vorliegt. 

Fur die Steilheit 5 car unteren Flanks der Mithcrschvelle gilt: 
S = 27 d3/3ark (5) 
Fur die Steilheit S der oberen Flanke der MithorschVbelle gilt: 
S = [- 24 - (0,23 kHz/f Qi ) + (0,2 • I^/dB)] [dB/3arkj (5) 

wobei f ^ die obere Grenzf requenz und der Signalpe- 
gel des betreffenden Teilbandes i bedeuten. 

Fiir die Erregungsverteilung innerhalb des Teilbandes i, 
welche die Grundlage fiir die spektrale Verdeckung dar- 
stellt, gilt: 

L Ek <f ui , = L k " S <Z k " Z i> (7) 

Die Gleichung (7) beschreibt die Verdeckung eines 

Teilbandes k auf ein TeiLband i. Die gesamte gegensei- 

tige Maskierung aus den verschiedenen Teilbandsignalen 

ergibt sich aus der Summation der Ampiituden der 

Erregungsverteilung innerhalb der einzelnen Teilbander. 

Die Maskierung des Signalpegels L. innerhalb des 
35 i 
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Teilbandes i aufgrund der Signale in alien anderen 
23 Teilbandern errechnet sich zu: 

LX. = L . - 10 lgf( ¥ 10 L Ek(fui)/20dB )2 + , Q L TH (f u i> /1 Od B ] 



+ 6 dB (8) 



Sin Teilbandsignal mit dem Signalpegel ist dann voll- 
standig verdeckt, wenn LX^< OdB ist, Eine teilweise 
Maskierung findet statt, wenn 



L.> LX.> O d3 (9) 
15 - x l • 

ist . 



Zeitiiche Mithor schwellen 



Die Verteilung der Quant is is rung auf die ver schiedenen 
Teilbander erfolgt nicht nur in Abhangigkeit der spek- 
tralen, sondern auch der zeitiichen Verdeclcung. Drei 
Zeitbereiche der Verdeckung, die in Fig. 7 dargestellt 
sind, konnen unter schieden werden . Die Vorverdeckung 
findet in einem Zeitbereich statt, bevor der Maskierer 
eingeschaltet ist. Wenn Maskierer und Testschall zur 
gleichen Zeit eingeschaltet sind, spricht man von 
Simultanverdeckung. Nach Abschalten des Maskierers 
findet eine Nachverdeckung statt* 

Die typische Dauer der Vorverdeckung liegt im Bereich 
von 10 ms bis 20 ms . Pegelanstiege rails sen in dieser 
relativ kurzen Zeit voll rekonstruiert werden. 
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Die Simul tanverdeckung ist bei kurzen Testschallimpul- 
sen von der Impulsdauer T abhangig; bei langeren 
Impuisdauern ist die Mithor schwel le unabhangig von der 
Dauer. Bei Verkurzung der Impulsdauer (T< 200 ms) 
steigt die Mi thor schwelle mit einer Steigung von 
- 10 dB/Dekade an. 

Die Nachverdeckung erstreckt sich bis etwa 200 ms nach 
Ausschalten des Maskierers. Die Machhorschwelien halten 
inner ha ib der er s ten 5 ms nach Abschalten. den Wert car 
S imui tanner schwe lie ur.d er re ic hen nach 2 CO ms den Wert 
der Ruhehorschwelis. Der Effekt der Nachverdeckung 
spieit aufgrund seiner Dauer eine viel wesentlichere 
Rolle als der Effekt der Vorverdeckung . Die Nachver- 
deckung ist auBerden von der Einschal tdauer des Maskie- 
rers abhangig. 3ei sehr kurzer Dauer- des Maskierers 
(T< 5 ms) falit die Nachhor schwelle bereits nach 20 ms 
auf den Wert der Ruhehorschwelle ab . 

Anwendung der Mithor schwe lien 



Die spektralen und zeitlichen Verdeckungseigenschaf ten 
werden in dem senderseitigen Transcoder 2 gemafl Fig. 1a 
genutzt, urn die Signale derjenigen Teilbander, welche 
durch benachbarte Te ilbandsignale nicht oder nur wenig 
verdeckt werden, f einer zu quantisieren, als solche 
Signale, welche sehr stark verdeckt sind und somit auch 
kaum wahrnehmbar sind, Signale in Teilbandern, die voll- 

kemmen verdeckt sind,d.h. unterhalb der resultierenden Mithor 
schwelle liegen, brauchen nicht ubertragen zu werden. 

Das Signal des betreffenden Teilbandes kann zu Null 

gesetzt werden. Urn das transcodier te Signal empfangs- 
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seitig in der Stufe 12 decodieren zu konnen (Fig. 2a) 
muG die in der Stufe 5 erzeugte S teuer information 
an der Stufe 12 vorliegen. Urn eine Mi tuber tragung 
dieser Steuer information zu vermeiden, werden als 
Eingangsinf orma tion der Stufe 5 die Skalenf aktoren die 
einzelnen Teiibander benutzt, welche ohnehin als Neben- 
in format ion im Mul t ip lexs ignal ubertragen werden, Daruit 
ist fur den emp f angsse i t igen inversen Transcoder 12 
a lie in aufgrund der Kenntnisse Ciber die Skalenf aktoren 
der einzelnen Teiibander und unter Zinbeziehung der glei- 
cren Kriterien fur die rasui tiarende Mi thorschweile wie Lr.de 
sender seit igen Stufe 5 eine genaue Zuveisung der Ruck- 
quantisisrung in die Ebene mit linearer Quantisierung 
(z.3, 16 bis 13 bit Auflosung pro Abtastwert) moglich. 

' 3er licks icht igung der Alias in g-Verzer yungen 

Unabhangig von der gegense it igen Verdeckung benachbar- 
ter Teiibander muB zur Verteilung der Quantisierung 
innerhalb der Teiibander auch die Wahrnehmbarkeit .von 
Aliasing-Verzerrungen berucksichtigt werden. Diese Ver- 
zerrungen entstehen durch die nicht ideale BandpaSf ilte- 
rung der QMF-Filterbank 1 / deren Ausgangssignal gerade 
rait der fur ein ideales Filter minimal moglichen Ab- 
tastfrequenz der zweifachen Bandbreite abgetastet wird. 
Die in den DurchlaBbereich eines Filters der Filterbank 
1 gefalteten Alias ing-Xomponenten werden jedoch auf- 
grund der QMF-Fil ter s truktur der Bank 1 nur bei gleicher 
Auflosung des Signals in benachbarten Bandpassen prak- 
tisch vollstandig eliminiert. In dem gewahlten Teilband- 
schema gemafl Fig. 8 sind Aliasing-Verzerrungen beziig- 
lich ihrer Wahrnehmbarkeit besonders im Bereich der 
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unteren sechs Teilbander kritisch, da die Bandbreiten 
der verwendeten Quadrature-Mirror-Filter groBer als 
die Breite einer Frequenzgruppe sind (vgl. Fig. 8). 
Im Bereich hoher Frequenzen sind die Aliasing-Ver- 
zerrungen weit unkritischer , da sie aufgrund der wesent- 
lich geringeren Breite der betreffenden Teilband- 
Quadrature-Mirror-Filter gegenuber den Frequenzgruppen 
eine starkere Maskierung durch das Nutzsignal erfahren. 

Um die Horbarkeit von Aliasing-Verzerrungen zu vermei- 
den, mussen die Hohen der Quantisierungsstuf en in den 
unteren Teilbandern z wise hen benachbarten Sandern mog- 
lichst ahnlich gewahit werden, wahrend bei den oberen 
Teilbandern groBere Unterschiede in den Hohen der 
Quantisierungsstuf en zwischen benachbarten Teilbandern 
auftreten dCirfen. 
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Puf f er speicher 



Fur die zusatzliche Einsparung am Inf ormationsf luB werden 
sende- und empf angsseit ig in den Transkodierern 2 und 
12 ?Ji?.fe£?P^i.cher fur die einzelnen Teiibandsignale be- 
notigt, wie spater anhand von rig. 11 noch naher er- 
lautert wird. Derartige Puf f erspeicher ermoglichen es, 
die Signale in etwa der Zeitdauer, wie sie den Nach- 
horschwellen des menschlichen Gehors entspricht, zu ver- 
zogern . 



Eine Verzogerung des Tonsignals urn einen Wert zwischen 
200 ms und 500 ms ist einerseits den zeitiichen Mithor- 
schwellen des Gehors optimal angepaBt und andererseits 
fur die Anwendung in der Praxis gut zu vertreten. Diese 
Verzogerung des Signals ist notwendig, urn eine effi- 
25 ziente Verteilung des Inf ormationsf lusses nicht nur auf 

die verschiedenen Teiibandsignale, sondern auch auf die 
zeitiichen Blocke, fiir welche jeweils ein Skalenfaktor 
bestimmt wurde , zu gewahrleisten . Die innerhalb des 
Zeitfensters variable Aufteilung des Inf ormationsf lus- 
ses gewinnt vor allem bei der Ber ticks ichtigung der "zeit- 
iichen Mithorschwellen an Bedeutung. So konnen schnelle 
Pegelanstiege der Teiibandsignale sehr genau, schnelle 
Pegelabsenkungen, welche durch die relativ langsam ab- 
fallenden Nachhorschwellen eine starke Maskierung er- 
fahren, hinreichend genau transkodiert werden. Die 
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zeitliche Verteilung der Quantisierung erfolgt hierbei 
5 ebenso wie die spektrale Verteilung auf die einzelnen 

Teilbander nach MaBgabe des Mithor schwellenkr i ter iums , 

wobei in Stufe 5.5 gemaS Fig- 3 beriicksichtigt wird, 

daB ein minimaler "mask-to-noise" Abstand gehalten wird. 

Dies kann beispielsweise dadurch erreicht werden, indem 
0 vom Puf f erspeicher ein Steuersignai mit Information liber 

den Ladezustand des Puf f erspeichers an Stufe 5.5 tiber- 

ceben wird. 
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Fehler sicherung der transkodierten Teilbandsignale 

5 

Die in der Stufe 7 (Fig. 1a) erfolgende Sicherung der 
Abtastwerte gegenuber Ubertragungsf ehlern kann aus 
folgenden Grunden stark vereinfacht werden : 

10 Die Storwirkungen von fehierhaft empfangenen Abtastwer- 

ten erstrecken sich nicht auf die gesamte Audio-Band- 
breite, sondern sind auf die Breite des zugehorigen 
Teiibandes beschrankt. Die maximale Amplitude der 
Storung in dam betref fenden Teiiband , ist durch die 

lo Ubertragung eines Skalenf aktor s in ihrer Hohe beschrankt. 

Dies bedeutet, daS die spektrale Verteilung fehierhaft 
empfangener .Abtastwerte sich der spektralen Grobstruk- 
tur des Nutzsignals annahert und somit eine groBtmog- 
liche Verdeckung bei Storungen durch Ubertragungsf ehler 

20 von Abtastwerten resultiert. 

Da bei bandpassbegrenztem Rauschen rait konstantem 
Pegel eine Lautstarkeabhangigkeit von der Bandbreite 
besteht, ist es zweckraaSig , Storungen in Teilbandern 
25 mit Bandbreiten, die groBer sind als die Frequenzgrup- 

pen des Gehors, eher zu vermeiden als Storungen in 
schmaleren Teilbandern. Ein Rauschen mit einer Band- 
breite iiber 2 Frequenzgruppen erzeugt bei mittlerem 
Schalldruckpegel die gleiche Lautstarkeerapf indung wie 
3° ein im Pegel um 3 dB angehobenes Rauschen, jedoch nur 
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frequenzgruppenfareit (vgl. Fig. 9), Damit sich Storun- 
gen lautstarkemaBig minimal auswirken, sollte das Stor- 
spektrum auf die Breite einer Frequenzgruppe reduziert 
werden . Da die Bandbreite in dem vorliegenden Teilband- 
schema (Fig. .8) in den untersten 5 Teilbandern (das 
1 . Teilband erstreckt sich liber insgesamt 5 Frequenz- 
gruppen) die Frequenzgruppenbre ite z.T. wesentlich 
uber schreitet , miissen die Abtastwerte der untersten 
2 Teilbander stark und die der 3- bis 5. Teilbander 
hinreichend gesichert werden. 

Quadrature-Mirror-FilterTincr in Stuf en • 1 und - 1 1 

Die in den Fign. 1a und 2a dargestellten 
sende- und empf angsseitigen Verarbeitungsschritte sind 
anhand des Funktionsscheraas gemaB Fig. 10 veranschau- 
Licht . 

Die mit dem digitalen Tonsignal gespeiste QMF-Filter- 
bank 1 besteht aus einer Kaskade von Mirrorf iltern MF , 
welche sukzessive das Tonsignalspektrum aufteilen, im 
betrachteten Beispielsf aile in 24 Teilbandsignale . 
Jedes Mirrorf liter MF stellt einen sog . "Finite-Impulse- 
Response" (FIR) -Filter dar , welcher ein digitales 
Eingangssignal in zwei/spiegelsymmetrisch zur Grenz- 
frequenz liegende Teilbander zerlegt. Hierzu wird die 
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Ersatz- 

Grenzfrequenz des /tief passes so gewahlt, daB sie der 
halben Bandbreite des Eingangssignals entspricht. 

Die 

Flankensteilheit der Tief paScharakter istik ist propor- 
tional der Anzahl der Xoef f izienten des FIR-Tief passes . 
Die Berechnung der Koeff izienten ist in der Literatur- 
stelle "Multirate Digital Signal Processing" von 
Chrochiere und Rabiner, Prentice-Hall-Verlag , Englewood 
Cliffs, N.J., U.S.A., beschrieben. Jedes Mirrorfilter 
MF teilt sein Eingangssignal in zwei gleichgrofle Teil- 
^- bander und halbiert dabei dessen Abtastrate , so.. daS die 

das Filter durchlauf ende Inf ormationsmenge prinzipiell 
unverbandert bleibt. Lediglich die Wortlange der zwi- 
schen dem kaskadierten Filtern MF ubergebenen Abtast- 
werte ist mit 20 bis 23 bit etwas grSSer als die vom 
Eingangssignal mit' ublicherweise 16 bis 18 bit, urn 
Rundungsf ehler infolge der Kaskadierung zu eliminieren. 
Eine Frequenzauf teilung in 2 4 Bander erfolgt bei einer 
Abtastrate von 32 kHz durch Teilung des Bereiches 
0 bis 8 kHz in 16 Bander zu je 500 Hz und von 8 bis 
16 kHz in 8 Bander zu je 1 kHz (vgl. Fig. 8) . Hierfur 
sind 5 bzw. 4 kaskadierte Filter MF notig . Die unver- 
meidbaren Alias-Verzerrungen als Folge der nicht unend- 
lich steilen Flanken der Ersatz-Tief paB-Filtercharak- 
teristik der Mirrorfilter MF kompensieren sich bei der 
Ruckf ilterung, falls die Quantisierung in den benach- 
barten Teilbandern gleich ist. 
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Durch die Kaskadierung wird die Qualitat der Filterbank 
stets optimal ausgenutzt, da bei gleicher Koef f izienten- 
zahl die zeitliche Lange des FIR-Tief passes und somit 
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die Steilheit pro Hertz in spateren Kaskadenstuf en 
zunimmt. Fur die Filterung sind 64 Koef f izienten je 
Filter ausreichend, denn es hat sich gezeigt, daB die 
Steilheiten der Filterf lanken nicht groBer sein miissen 
als die maximale Steilheit der Mithorschvellenkurve . 



Wird in jeder Filterstufe der gleiche Koef f izientensatz 
verwendet, so wird die Filtersteilheit umso groBer, je 
geringer die Abtastrate durch vorangegangene Spektral- 
teilungen geworden ist . In den letzten Fil terkaskaden 1st 
diese Steilheit nicht unbedingt notig, da sie nicht an 
alien Bandgrenzen erreicht wird. Verwendet man daher in 
den letzten Filterkaskaden Filter mit weniger Koeffizien- 
ten, so verringert sich in erster Linie die Signallauf zeit , 
was bei einer Echtzei tanwendung ; wie z.B. bei einer Rund- 
f unkiibertragung von Bedeutung ist. Urn diese fur das Gehor 
erf orderliche Flankensteilheit zu erhalten, sind 16 Filter- 
koeff izienten in der letzten Filterkaskade ausreichend. 



Bei realen Filtern ist eine Res twelligkeit vorhanden, die 
sich zwar nicht spiirbar im Frequenzgang auswirkt (Rest- 
welligkeit < 0.002dB), .jedoch bei zeitlich sehr kurzen 
Impulsen zu einem noch horbaren "Filterkiingeln" fiihren 
kann. Dies sind Nebenimpulse , die 10 ms bis 100 rus vor und 
nach dem Hauptimpuls mit einem Pegel von ca. -80 dB 
gegeniiber dem Nutzsignal entstehen. Urn diese u.U. horbaren 
Signalfehler zu vermeiden, wird das Signal vor der 
eigentlichen Codierung einer Hin- und Riickf ilterung , nicht 
jedoch einer Datenredukt ion unterzogen. Das durch diese 
Hin- und Riickf ilterung entstandene Fehlersignal wird 
extrahiert und dem zu codierenden Originalsignal invers 
hinzugefiigt. Die storenden Eigenschaf ten der Filter im 
Coder und Decoder sind somit ausreichend unterdruckt. 
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Transkodierung und Bestimmung def Skalenf aktoren in 
Stufen 2 und 4 

In der Transkodierungsstuf e 2 erfolgt eine Reduktion 
der Auf losung der ankommenden Teilbandsignale von 
16 (18) bit bis zu 1,5 bit pro Abtastwert. Dies be- 
deutet sine Herabsetzung der Stufenzahl der Abtast- 
werte in jedem Teilband. Hierzu wird pro Teilband zu- 
nachst aus einer bestimmten Anzahl zeitlich aufeinan- 
der f olgendsr Abtastwerte (= Block) 'der Betrag des 
maxima len Abtastwertes gesucht, welcher dann einem 
Klassierungsschema zugeordnet wird- Dieses Schema be- 
steht aus 64 Klassen entsprechend 6 bit, welche den 
Dynamikumf ang einer 16 bit-PCM (96 dB) in 96/64 dB = 
1,5 dB pro Stufe unterteilen. Die dem maximalen Abtast- 
vert entsprschende Stuf ennummer stellt den Skalenfaktor 
der betrachteten Folge von Abtastwerten dar. Der in 
Stufe 4 ermittelte Skalenfaktor wird der Transkodierungs- 
stuf e 2 zugeftihrt, welcher ferner von der Stufe 5 eine 
Information uber die Anzahl der je Block erf orderlichen 
Quantisierungsstuf en (aufgrund des dort angewendeten 
Mithorschwellenkriteriums) sowie von der Stufe 6 eine 
weitere Information uber die gewiinschte Qualitat der 
Quellkodierung zugefuhrt werden. 

Wie aus Fig. 11 im einzelnen hervorgeht, weist die 
Stufe 2 einen regelbaren Verstarker 2.1 fur die linear 
quantisierten Teilbandsignale auf, welcher vom Skalen- 
faktor aus Stufe 4 gesteuert wird. Die verstarkten 
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Teiibandsignale durchlaufen ein steuerbares VerzSgerungs- 
glied 2.2, das fur die Berucksichtigung der zeitlichen 

o 

Mithorschwellen notwendig ist (vgl. Abschnitt 
"Pufferspeicher") . Die verstarkten und verzogerten Teii- 
bandsignale werdsn in dem Quantisierer 2.3 unter der 
Steuerung der Stufen 5 und 6 umquantisiert . 

10 

Der durch den Skalenfaktor reprasentierte Bereich in 
positiver und negativer Richtung wird durch die jeweils 
vorgegebene Anzahl von Quantisierungsstuf en unterteilt. 
Dies bewirkt, daS die Stufenhohe bei kleinen Skalenf ak- 

15 

toren entsprechend kleinen Wertebereichen geringer und 
damit die Auflosung hoher ist als umgekehrt bei groBen 
Skalenf aktoren entsprechend groBen Wertebereichen . 
Durch die Unterteilung des breitbandigen Nutzsignals in 
Teiibandsignale konnen deshalb Spektralanteile mit 
kleinem Pegei individueli hoher aufgelost werden, als 
bei einer Insgesamt-Quantisierung des breitbandigen 
Nutzsignals, bei der solche kleinpegeligen Spektralan- 
teile mit begrenzter gleicher Genauigkeit aufgelost wer- 
den wie Spektralanteile mit hohem Pegel . 

25 

Urn einerseits Pegelanstiege wegen der relativ kurzen 
Vorverdeckung des menschli.chen Gehors folgen zu konnen, 
andererseits den Skalenfaktor nicht zu haufig ubertra- 
gen zu miissen, wird der Sk alenfaktor z.B. zwar fur ie 
3° 4 Abtastwerte gebildet , aber nur ieder zweite Skalen - 

faktor ubertragen • Urn die nicht-ubertragenen Skalen- 
f aktoreri empf angerseitig rekonstruieren zu konnen , 
wird fur die den weggelassenen Skalenf aktoren zugeord- 
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neten 4er-B16cke ein Inf ormationsbit ubertragen, wel- 
ches die Gultigkeit des vorangegangenen oder des folgen- 
den Skalenfaktors fur die Skalierung des betreffenden 
4er-Blocks angibt. Diese Verhaltnisse sind schemati- 
sierf anhand der Fig. 12 und 13 erlautert. 

In Fig, 12 ist die Skalenf aktorbildung fur einen Pegel- 
verlauf mit Blocken zu je 8 Abtastwerten dargestellt; 
Fig. 13 zeigt den gleichen Pegelverlauf mit Blocken zu 
je 4 Abtastwerten, wcbei nur jeder zweite Skalenfaktor 
zu 5 bit ubertragen und ein zusatzliches Inf orma- 
tionsbit aufgewendet wird, so dafi statt 6 bit/8 Abtast- 
werte nunmehr 7 bit/8 Abtastwerte ubertragen werden. 
Wie Fig, 13 zeigt, wird der zwischen den Skalenf aktoren 
S n und S n+1 befindlich e Pegelanstieg zeitlich exakter 
erfaflt als im Falle von Fig, 12. Das In Fig. 12 zwangs- 

laufig starkere Quantisierungsrauschen (groBer Wert S ) 

n. 

tur die ersten 4 zum Skalenfaktor S n zugehorigen 
Abtastwerte fallt wegen des in Fig. 13 niedrigeren 
Skalenfaktors mit entsprechend feineren Quantisierungs- 
schritten geringer aus . Auch bei zeitlich sehr kurzen 
Pegelspitzen (innerhalb eines Zeitraums von weniger als 
4 Abtastwerten) wird der Pegelansteig mit Hilfe des 
zusatzlichen Inf ormationsbits (Fig. 13) zeitlich besser 
angenahert, wobei es auf den zugehorigen Pegelabfall 
wegen der wesentlich langeren Nachdeckung des mensch- 
lichen Gehors weniger ankommt und damit auch langere 
"Rauschfahnen" toleriert werden konnen. 



35 



Skalenfaktor und zusatzliche Inf ormationsbits werden 
in jedem Teilband wie folgt erzeugt, wobei zum besseren 
Verstandnis angenommen sei, daB hier nur die 
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Skalenfaktoren mit geradzahligem Index S 2n r S 2n+2 * ' * ubertragen 
wercen. 



< jl1 < S 0 nachstliegender 

Pegelwert 

2n 2n+1 2n + 2 2n + 2 2n+1 

10 S 0 > > S- nachstliegender 

Pegelwert 

2n 2n+l 2 n + 2 2 n + 1 . 2 n 



15 Urn das starre Klassierungsschema fur den Skalenfaktor 

in 1/5 dB-Stufen zu verfeinem, ist die Ubertragung 
einer Zusat zinf ormation vorgesehen, die den durch diese 
Klassierung ent stehenden Fehler minirniert. Vorgese- 
hen ist - fiir die Frequenzbereiche von 1,5 bis 3/5 kHz 

20 sowie von 3,5 bis 8 kHz alle 8 Abtastwerte je eine 

3 bit-Zusatzinf ormation , welche die gesamte Abweichung 
vom 1,5 dB-Raster in alien auf diese beiden Frequenz- 
bereiche entfallenden Teilbander gemafl Fig ,8 in 
(1/8) * 1,5 dB-Schritten angibt. Dies komrat z.B. Ein- 

25 zeltonen zugute , deren Pegelanderungen mit etwa 0,2 dB 

Genauigkeit iibertragen werden konnen • 

Die Wahl dieser Feinrasterung soil nach MaEgabe eines 
minimalen quadratischen Fehler s erfolgen, so dafl nur 

30 die stark modulierten Teilbander die Feinrasterung 

bestimmen. Die Zusatzinf ormation gilt also nicht fur 
alle Teilbander, was folgenden Grund hat: in dem ge- 
wahlten Teilbandschema geraaS Fig. 8 ist die Bandbreite 
der unteren dro. Teilbander bis 1,5 kHz wesentlich 

35 groBer als die der Frequenzgruppen des menschlichen 
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Gehors, .so daB die Verdeckung innerhalb dieser drei Teil- 
bander relativ gering ist. Es ist daher fur diese drei 
Teilbander eine relativ hohe Auflosung erf orderlich , 
beispielsweise von 10,6 bit/Abtas twert fur das Teilband 
von 0,5 bis 1 kHz. Unterhaib von 1 kHz werden die Nach- 
teile der Klassierung fiir den Skalenfaktor wegen dieser 
relativ hohen Auflosung fur diese 3 Teilbander bedeu- 
tungslos. Oberhalb von 8 kHz wird die 1,5 dB-Klassie- 
rung als ausreichend empfunden. 

Eine welters Eigenschaf t der Tran skodier ung s s tuf s 2 
besteht darin, daB ein Skalenfaktor der GroSe Null 
so verarbeitet wird, daB fur alle reduzierten Abtast- 
wert-Angaben der betreffende Block des betreffenden 
Teilbandsignals nicht iibertragen wird. Das gleiche 
gilt, wenn die Stufe 5 in einem Teilband feststellt, 
daB der Skalenfaktor unterhaib der betreffenden Mithor- 
schwelle liegt (gegenseitige Maskierung) , worauf die 
Stufe 5 an die Stufe 4 den Steuerbefehl "setze den 
Skalenfaktor auf Null" gibt. 

Ferner kann in der Stufe 4 fur jedes Teilband eine 
zuschaltbare Rauschsperre vorgesehen werden, um Leer- 
kanalrauschen, Ungenauigkeiten bei der A/D-Wandlung 
und dgl. zu unterdrucken . Hierbei ist es denkbar , ein- 
stellbare Schwellwerte vorzusehen. 

Bei der Quantisierung der Stufe 2 rauB eine ungerade 
Anzahl von Quantisierungsstuf en vorgesehen werden, um 
zu verhindern, daB Werte nahe Null" in einen standigen 
Wechsel zwischen zwei Quantisierungsstuf en uberfuhrt 
werden. Ansonsten konnten Anteile entstehen, die weit 
iiber dem Signalpegel des Teilbandes liegen. Nicht alle 



WO 88/04117 





S tufenzahlen konnen direkt in digitale Werte umgewandelt 
werden, ohne da8 man darstellbare Werte und somit Uber- 
tragungs-Kapazitat verschenkt. Z.B. mtiSte man fur die 



aufwenden; die 4. Kombinationsmoglichkeit dieser 2 bit 
bliebe j edoch unbenutzt und wiirde hier 33% mehr Auf- 
wand an Inf ormationsmenge bedeuten. 

Derartige Verluste an ubertragungskapazitat lassen 

s i c h minimieren, indem man mehrere Abtastwerte zusam- 

rr.en in ein Datsnwort kodiert. Beispielsweise ergeben 

5 Abtastwerte rait je 3 Stufen 243'= 3° Kombinationsmog- 

lichkeiten, die mit 8 bit, also 256 Zustanden bei gerin- 

ger Irrelevanz und wenig Kodierungsauf wand ubertragen 

werden konnen. 

Zusatziiche Spektralanaly se zur Gewinnung dsr Steuer- 
information 

Ein weiteres Ausf uhrungsbeispiel des erf indungsgemaflen 
Verfahrens ist in den Fign, 1d (Sendeseite) und Fig* 2d 
(Empf angerseite) dargesteiit* Ein wesentlicher Teii der 
S teuerinf ormation fur die Quantisierung der Abtastwerte 
wird aus dem Spektralverlauf des Tonsignais gewonnen. 
Urn diese Information zu gewinnen y wird sendeseitig eine 
Four ier zerlegung des Tonsignais durchgef iihrt , die z.B. 
durch eine Fast-Fourier-Transformation realisiert werden 
kann. Durch. diese Fourier-Transformation ergeben sich im 
wesentlichen die folgenden Vorteile: 



Darstellung von 3 moglichen Stufen 



2 bit an I 



nf ormation 
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genauere Spek traldars tellung gegeniiber einer BandpaB- 
aufteilung des Tons ignals . 

Die tonalen Anteile konnen von den mehr rauschhaf ten 
3es tandte ilen eines Tonsignals un ter schieden werden . 

Die genauere Spektralanalyse una Un ter scheidung in 
tonaie una rauschhaf te Sestandteile ermcglicht eine 
ef f ektivere 3es tinmung der Mi thorschwellen creceniiber 
ceru Fall, da 3 die SteuergroBen nur aufgrund einer be- 




Reduzierung des Hardwareauf wandes auf der Empf angssei te 
he i gieichzeitig kurzerer Verzcgerungs zei t der Ton — 
signaiubertragung and gieicher Uber tragungsrate des 
Multipiexsignals vie ohne diese zusatzliche MaBnahme. 

Die Reduzierung des Hardwareauf wandes besteht car in , daB 
weniger Handpasse verwendet werden konnen. Die geringere 
Anzahl an Bandpassen bedeutet in erster Linie einen 
geringeren Prozessorauf wand , was sich besonders bei der 
Entwicklung eines kos tengunstigen Empfangers positiv 
auswirkt. 3reitere Teilbander ermoglichen eine kiirzere 
Gesamtver'zogerungszeit des Systems- In den Fign . 1d und 
2d ist der Reduzierung des Hardwareauf wandes insofern 
Rechnung getragen, daQ statt der 24 Teilbander in der 
vorigen Ausf iihrungsf orm nun nur noch 1 6 Teilbander gegen- 
uber s tehen Der durch die breiteren Teilbander grundsatz- 
lich hohere Datenflufl der transkodier ten Teilbands ignale 
kann durch die genauere 3estimmung der Mithorschwellen in 
etwa wieder kompensiert werden. 
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Eine ausreichende Spek tralauf losung im Bereich tiefer • 
Frequenzen des Tonsignals wars durch eine spektrale 
Darstellung benachbarter Stutzwerte von etwa Af = 10 Hz 
gegeben. Da der entscheidende Vorteil der genauen 
Spektralbes timmung fur die Ermittlung der Mithorschwellen 
im unteren Teil des Frequenzbereiches gegeben ist 
(22 der insgesamt 24 Frequenzgruppen des Gehors. liegen 
im Frequenzbereich bis 10 kHz) , genugt eine Spek tralanaly se 
bis etwa 10 kHz. 3ei airier Spek traldar s tellung des 
Amplitudenspektrums mit 512 reeilen Stiitzwerten ergibt 
sich demit ein Abstand benachbarter Stutzwerte von 
^f = 20 Hz. Mittels geeigneter Interpola tionsalgor i thmen 
ist fur diskrete tonale Komponenten eine genauere Freauenz- 
bes timmung aufgrund der Auswertung benachbarter Frequenz- 
stiitzpunkte moglich. 

Die Eingangsgroflen des Slocks dynamische Verteilung des 
Informationsf lusses (sh. Fig, 1d) bestehen zusatzlich 
zu den SteuergroBen aus der FFT-Analyse auch aus Steuer- 
groGen fur die Festlegung der Qualitat und Kanalzahl, 
sowie aus den Skaienf aktoren der einzelnen Teilbander. 
Durch einen Vergleich der S teuergroflen aufgrund der FFT- 
Analyse und den Skaienf aktoren konnen die Aliasing-Ver- 
zerrungen, die sich durch die unterschiedliche Quanti- 
sierung in den Teilbandsignalen empf angsseitig nicht mehr 
vollstandig kompens ieren , bei der dynamischen Verteilung 
des Informationsf lusses ausreichend genau berucksich tigt 
werden. 
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Stuf enwsise Datenreduktion 

5 

In verschiedenen Anwendungs fallen des erf indungsgemaSen 
Verfahrens ist eine stufenweise Datenreduktion der Tonsigna- 
le vorteilhaft. Fur die tfbertragung hochwertiger Tonsignale 
zwischen zwei Studios beispielsweise mufl die Datenreduktion 

10 so erfolgen, daS eine ausreichende "mask-to-noise "-Reserve 

gewahrleistet ist, um Nachbearbeitungen ohne Qualitatsein- 
buBe zu ermoglichen (Studioqualitat, vgl . Abschnitte 
"Nutzung des schvankenden Inf o rotations f lusses : Erhohter 
Rauschahstand" sowie "Qual i tat sab stuf una " ) . Fur die weitere 

15 Verteilung und/oder Speicherung ist ein erhohter Rauschab- 

stand nicht erf orderlich , so daB die gemaB Studioqualitat 
codierten Tonsignale einer weitergehenden Datenreduktion 
unterworfen werden dlirfen. 

20 Eine vorteilhafte Ausbildung des erf indungsgemaSen Ver- 

fahrens liegt darin, daB die verschiedenen Qualitatsab- 
stufungen der erf indungsgemaB codierten Tonsignale 
"abwartskompatibel" sind, d.h. / daB beispielsweise ein 
192 kbit/s-Multiplexsignal mit Hilfe eines speziellen 

25 Transcoders in ein 128 kbit/s-Multiplexsignal umgesetzt 

werden kann, wobei die 192 kbit/s-Codierung einen erhohten 
Rauschabstand (Nachbearbeitungsf ahigkeit) gewahrleistet 
und die 128 kbit/s-Codierung einen kleineren Rauschab- 
stand und einen hoheren Fehlerschutzgrad vorsieht. 

30 

Fig. le zeigt ein Ausf uhrungsbeispiel eines derartigen 
Transcoders. Er besteht aus den Stuf en 12,13,15,17,18 des 
Decoders gemaB Fig- 2a sowie aus den Stuf en 2,3,5,7,8 
des Coders gemaB Fig. la. Er ist dadurch gekennzeichnet , 
35 daB das 192 kbit/s-codierte Tonsignal nicht vollstandig 
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zuriickgewonnen und neu codiert wird, sondern daB die Ne- 
beninf ormationen (Skalenf aktoren) , welche aus dem Original- 
signal gewonnen sind, fur die neue Codierung im rechten 
Teil des Transcoders (Stufen 2,3,5,7,8) zugrunde gelegt 
werden. Dadurch wird eine Verminderung des Rauschab- 
standes durch Kaskadierung vermieden. Da die Riickf ilterung 
und Hinf ilterung (Stufen 11 und 1 in Fign. 2a bzw. 1a) 
entf alien, ist die durch den Transcoder gemaB Fig, 1e 
verursachte Ver zogerungs zeit klein (etwa 4. ras) . 
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Verfahren zum ubertragen digitalisierter 
Tons ignale 



Patentanspruche 



Verfahren zum Ubertragen oder Speichern digitalisier- 
ter Tonsignale, bei dem sende- bzw. produktionsseitig 

a) das Tonsignal durch eine Vielzahl spektraler 
Teilbandsignale digital dargestellt wird, wobei 
fur jedes Teilbandsignal zeitdiskrete, quanti- 
sierte Abtastwerte vorliegen; 

b) die Quantisierung der Abtastwerte in den 
einzelnen Teilbandern nach MaBgabe der jeweili- 
gen Mithorschwellen des menschlichen Gehors im 
Sinne einer Informationsreduktion geandert 
(codiert) wird, wobei die Hohe des fur die Lfber- 
tragung oder Speicherung aller codierter Teilband- 
signale erf orderlichen Gesamtinf ormationsf lusses 
in Abhangigkeit der spektralen und zeitlichen 
Struktur des Tonsignals schwankt, und 
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c) die codierten Teilbandsignale iibertragen oder 
gespeichert werden , und bei dem wiedergabe- 
seitig 

d) die codierten Teilbandsignale decodiert werden, 
und 

e) die decodierten Teilbandsignale zu einem 
breitbandigen digitalen Tonsignal zusammenge- 
fiigt werden, 

dadurch gekennzeichnet, 
daB nach MaBgabe der Pegelwerte jedes Teilband- 
signals oder davon abgeleiteter Pegelinf ormationen 
die Quantisierung der Abtastwerte in den Teilban- 
dern dahingehend gestsuert wird, daB die Quanti- 
sierungsrauschpegel der einzelnen Teilbandsignale 
naherungsweise gleiche Abstande zu der aus einzel- 
nen Teilbandsignalen resultierenden Mithorschwelle 
aufweisen, und daB die Abstande der Quantisierungs- 
rauschpegel der Teilbandsignale zu der resultieren- 
den Mithorschwelle du-rch die Differenz zwischen dem 
erf orderlichen Gesamtinf ormationsf luB und dem fiir 
die Codierung verfiigbaren Gesamtinf ormationsf luB 
festgelegt sind. 

Verfahren nach Anspruch 1, dadurch gekennzeichnet, 
daB die Hohe des verfiigbaren Gesamtinf ormations- 
flusses variabel ist, ggf. auch etwa gleich dem 
erf orderlichen Gesamtinf ormationsf luB ist, und 
wiedergabeseitig eine entsprechende Anpassung der 
Decodierung erf olgt • 
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3. Verfahren nach Anspruch 1 und 2, dadurch gekenn- 
zeichnet, dafl die Quantisierungsrauschpegel der 

5 Teilbandsignale unterhalb oder oberhalb der 

resultierenden Mithorschwelle liegen . 

4. Verfahren nach einem der Anspruche 1 bis 3, dadurch 
gekennzeichnet, daS Teilbandsignale, welche die 

10 Klangfarbe des Tonsignals nur geringfiigig beein- 

flussen und deren Pegelwerte oberhalb der resultie- 
renden Mithorschwelle liegen, zu Null gesetzt werden, 
falls die Quantisierungsrauschpegel der Teilband- 
signale oberhalb der resultierenden Mithorschwelle 

15 liegen. 

5. Verfahren nach Anspruch 4, dadurch gekennzeichnet , 
dafl nur soviele Teilbander zu Null gesetzt werden, 
wie erforderlich ist, urn den Quantisierungsrausch- 

20 pegel der Teilbandsignale soweit zu reduzieren, daS 

er gerade unterhalb der resultierenden Mithorschwelle 
liegt. 

6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, 
25 daS diejenigen Teilbander zu Null gesetzt werden, 

welche die groflere absolute Bandbreite aufweisen. 

7. Verfahren nach einem der Anspruche 1 bis 6, dadurch 
gekennzeichnet, dafl die Hohe des Inf ormationsf lusses 

30 eines codierten Nutzsignals stufenweise etwa urn den 

ganzzahligen Faktor n reduziert wird und stattdessen 
n-1 zusatzliche Nutzsignale ubertragen werden. 
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8. Verfahren nach Anspruch 1, dadurch gekennzeichnet, 
da3 die resul tierende Mithor schwelle nach MaSgabe 
der Pegelwerte in jedem Teilband unter Berucksichti- 
gung der GesetzmaBigkei ten fur die Vor- ; Simultan- 
und Nachverdeckung gewonnen wird. 

9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, 
daB die Beriicksichtigung der zeitlichen Mithor- 
schwellen nach MaSgabe der innerhalb eines Zeit- 
fensters von etwa 500 ms vorliegenden Teilband-Pegel- 
werte erfolgt. 

10. Verfahren nach Anspruch 1, dadurch gekennzeichnet, 
dafl Teilbandsignale , deren Pegelwerte unterhalb der 
resultierenden Mithorschwelle liegen, nicht oder 
nur mit geringer Auflosung codiert werden • 

11. Verfahren nach Anspruch 1, dadurch gekennzeichnet, 
da8 die Hone der Quantisierungsstuf en der Teilband- 
signale so bemessen ist, daB die bei der Aufteilung 
des digitalisierten Tonsignals in Teilbandsignale 
entstehenden Aliasing-Verzerrungen unterhalb der 
Mithorschwelle des menschlichen Gehors liegen. 

12. Verfahren nach Anspruch 1, dadurch gekennzeichnet, 
daB 

sendeseitig. fur jedes digitalisierte Teilband- 
signal ein Skalehfaktcr bestimmt wird, welcher 
den Spitzenwert des Teilbandsignalpegels inner- 
halb eines bestimmten Zeitintervalls klassiert; 
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bei der Codierung jedes Teilbandsignals dessen 
Auflosung nach MaBgabe des ermittelten Skalenfak- 
tors festgelegt wird; 

die ermittelten Skalenf aktoren zusammen mit den 
* codierten Teilbandsignalen iibertragen werden, und 

die iibertragenen Skalenf aktoren bei der Decodie- 
rung der empfangenen codierten Teilbandsignale 
zur Rekonstruktion des ur spriinglichen Teilband- 
signals verwendst werden. 

13. Verfahren nach Anspruch 12, dadurch gekennzeichnet, 
daB die Anzahl der Klassierungsstuf en bei der Skalen- 
f aktorbestimmung so gewahlt ist, dafi die Wahmehm- 
barkeitsschwelle fur Pegelsprlinge innerhalb des 
zugeordneten Teilbandes unterschri tten ist. 

14. Verfahren nach Anspruch 12 oder 13, dadurch gekenn- 
zeichnet, daB das Zeitintervall. zur Klassierung des 
Spitzenwertes des jeweiligen Teilbandsignales ent- 
sprechend der zeitlichen Verdeckung des menschlichen 
Gehors und entsprechend der zeitlichen Struktur des 
Teilbandsignals innerhalb des zugeordneten Teilban- 
des bestimmt ist. 

15. Verfahren nach einem der Ansprliche 12 bis 14, da- 

30 

durch gekennzeichnet , daB fur jeden aus einer Folge 
von Abtastwerten bestehenden Block jedes Teilband- 
signales nur fur die erste Blockhalfte der Skalen- 
faktor bestimmt wird, und daB fur die zweite Block- 
halfte der Skalenfaktor der ersten Halfte desselben 
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Oder des nachf olgenden Blockes verwendet wird. 



1 6 



Verfahren nach einera der Anspruche 1 bis 15, 
dadurch gekennzeichnet , daS sende- und empfangs- 
seitig aus den Skalenf aktoren der Teilbandsignal 
die Steuerinformationen fur die Quantisierung d 
10 Abtastwerte in den Teilbandern gewonnen werden . 



e 
er 



17. Verfahren nach einem der Anspruche 11,8,9 und 16, 
dadurch gekennzeichnet, daS die S tevuerinf ormationen 
fur die Quantisierung der Abtastwerte . nur sendesei- 

15 tig 5ewonnen und fur die empf angsseitige Ruck- 

quantisierung zusatzlich ubertragen. werden. 

18. Verfahren nach Anspruch 17, dadurch; gekennzeichnet, 
dafl sendeseitig die S teuerinf ormatiionen fur die 

20 Quantisierung der Abtastwerte nach 35aflgabe einer 

ausgewahlten Spektralanaiyse des diicgitalen Tonsignals 
gewonnen werden. 



1 9. 



20, 



Verfahren nach den Anspriichen 1 undi 12,. dadurch 
gekennzeichnet, dafi vor ihrer Ubertxragung die Skalen- 
faktoren einer hoheren Fehlersicherxaag, unterzogen 
werden als die transcodierten Abtastwerte der 
Teilbandsignale . 

Verfahren nach Anspruch 1, 17 und 18 diadurch gekenn- 
zeichnet, da3 vor ihrer Ubertragungc cdie Steuer- 
informationen einer hoheren Fehlersdicherung unter- 
zogen werden als die transcodiertem abtastwerte der 
Teilbandsignale . 
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Verfahren nach Anspruch 19 und 20, dadurch gekenn- 
zeichnet, daB die Fehlersicherung der Skalenf aktoren 
und/oder der Steuerinformationen in Teilbandern 
groBerer relativer Bandbreite hoher 1st als in Teil- 
bandern kleinerer relativer Bandbreite. 

Verfahren nach Anspruch 1, dadurch gekennzeichnet , 
daB die transcodierten Abtastwerte in den Teilban- 
dern einer Fehlersicherung unterworfen werden , 
derart, daB in Teilbandern groBerer relativer 
Bandbreite ein hoherer Fehlerschutz besteht als m 
Teilbandern kleinerer relativer Bandbreite. 

Verfahren nach einem der Anspruche 1 und 1 9 bis 22, 
dadurch gekennzeichnet, daB die Inf or.ationsmenge 
fur den Fehlerschutz (Fehlerschutzgrad) nach MaB- 
gabe der soektralen und zeitlichen Struktur des 
digitalen Tonsignals bemessen wird, derart, daB 

- fur Tonsignale, welche fur die ubertragung einen 
geringen Gesamtinf ormationsf luB benotigen, exn 
hoher Fehlerschutzgrad vorgesehen wird, und 

- fur Tonsignale, welche fur die Ubertragung einen 
hohen GesamtinformationsfluB benotigen, ein ge- 
ringer Fehlerschutzgrad vorgesehen wird. 

Verfahren nach Anspruch 23, dadurch gekennzeichnet , 
" daB der signalabhangige Fehlerschutzgrad so bemessen 
tirdt daB die durch Bitfehler verursachte sub je ktive 
Storung fur wenig verdeckende Tonsignale nicht 
groBer ist als fur stark verdeckende Tonsignale. 
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25. Verfahren nach Anspruch 1, dadurch gekennzeichnet , 
dafl bei Unter schrei tung eines Pegelschwellwertes 
eines Teilbandsignales dessen Abtastwerte nicht 
transcodiert werden. 

25. Verfahren nach einem der Anspruche 4 bis 6 und 
12 bis 16, dadurch gekennzeichnet, daS der 
Skaienfaktor eines Teilbandes die Information 
daruber enthalt, dafl die Abtastwerte dieses Teil- 
bandes innerhaib eines 3lockes Null betragen und 
nicht ubertragen werden. 
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